ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.12.2023
Просмотров: 256
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
когда Америка вступила в Первую мировую войну, и возникла необходимость быстро определить интеллектуальный уровень полутора миллионов вступающих в ряды армии. С этой целью использовались тесты интеллекта Артура Синтона Отиса. Тесты Отиса включали два вида: альфа-вербальный тест для владеющих английским языком и бета- тест – невербальный, рассчитанный на неграмотных и новобранцев иностранного происхождения. По окончании Первой мировой войны после некоторой переработки эти тесты стали повсеместно использоваться как групповые тесты интеллекта в образовательных учреждениях, среди взрослого населения.
В 1915 г. американец Р.М. Йеркс предлагает новую систему подсчета результатов испытуемых. Он вводит балльную систему (за правильное решенное задание теста испытуемый получает определенное количество баллов) вместо возрастных долей, которые использовались А.Бине. Полученное количество баллов затем переводилось в коэффициент одаренности или успешности в соответствии с разработанными стандартами
[3].
2. Психологические и педагогические тесты
В начале ХХ века также возникает идея использования тестирования для измерения уровня учебных достижений. Американский психолог В.А.Макколл предлагает разделить тесты на психологические (определение уровня умственного развития) и педагогические
(измерение успешности учащихся по предметам за определенный период обучения).
Целью педагогического тестирования, по мысли Макколла, должно быть выделение и объединение учащихся с близкими показателями уровня обученности.
Основоположником педагогических измерений считается американский психолог
Эдуард Ли Торндайк, который создал первый педагогический тест (ability tests). Первые тесты учебных достижений представляли собой тесты на решение арифметических задач, правописание, оценку почерка, рассуждение. Свои выводы по использованию тестовых методов в педагогике Торндайк обобщает в книге «Введение в теорию психологии и социальных измерений» (1904).
3. Тестология в России
В России интерес к разработке тестов и практике их использования формируется в
20-х г. ХХ века. Видные российские психологи и педагоги занимались этой проблемой, среди них С.Г. Геллерштейн, П.П. Блонский, А.П. Болтунов, М.С. Бернштейн, Л.С.
Выготский, Г.И. Залкинд и др. В книге С.М.Василейского «Введение в теорию и технику психологического, педологического и психотехнического исследования» (1927) изложены основные теоретические и практические принципы создания и использования тестов. В работе также были освещены вопросы статистической обработки результатов, проведения тестирования, методы изучения различных профессий. В 1925 году при педагогическом отделе Института методов школьной работы была создана особая Тестовая комиссия, которая способствовала организации деятельности педагогов и психологов по разработке тестов для советской школы. На основе американских были разработаны тесты по счету, решению задач, на понимание чтения, на правописание, на знание географической карты.
Тесты сопровождались инструкциями по его проведению и выполнению заданий, а также личными карточками учета роста учебных достижений учащегося.
Под руководством П.П.Блонского осуществлялась проверка шкалы Бине-Симона, создание школьных тестов и построение стандартов. В Ленинградском научно- педагогическом институте им. А.И.Герцена и Детском обследовательском институте им.
А.С. Грибоедова разрабатывались тесты диагностики одаренности и тесты школьной успешности для массовых обследований детей нормальных школ.
Постановление ЦКВКП(б) «О педологических извращениях в системе Наркомпроса»
(1936) запрещает использование тестов в педагогической практике советской школы.
В 1915 г. американец Р.М. Йеркс предлагает новую систему подсчета результатов испытуемых. Он вводит балльную систему (за правильное решенное задание теста испытуемый получает определенное количество баллов) вместо возрастных долей, которые использовались А.Бине. Полученное количество баллов затем переводилось в коэффициент одаренности или успешности в соответствии с разработанными стандартами
[3].
2. Психологические и педагогические тесты
В начале ХХ века также возникает идея использования тестирования для измерения уровня учебных достижений. Американский психолог В.А.Макколл предлагает разделить тесты на психологические (определение уровня умственного развития) и педагогические
(измерение успешности учащихся по предметам за определенный период обучения).
Целью педагогического тестирования, по мысли Макколла, должно быть выделение и объединение учащихся с близкими показателями уровня обученности.
Основоположником педагогических измерений считается американский психолог
Эдуард Ли Торндайк, который создал первый педагогический тест (ability tests). Первые тесты учебных достижений представляли собой тесты на решение арифметических задач, правописание, оценку почерка, рассуждение. Свои выводы по использованию тестовых методов в педагогике Торндайк обобщает в книге «Введение в теорию психологии и социальных измерений» (1904).
3. Тестология в России
В России интерес к разработке тестов и практике их использования формируется в
20-х г. ХХ века. Видные российские психологи и педагоги занимались этой проблемой, среди них С.Г. Геллерштейн, П.П. Блонский, А.П. Болтунов, М.С. Бернштейн, Л.С.
Выготский, Г.И. Залкинд и др. В книге С.М.Василейского «Введение в теорию и технику психологического, педологического и психотехнического исследования» (1927) изложены основные теоретические и практические принципы создания и использования тестов. В работе также были освещены вопросы статистической обработки результатов, проведения тестирования, методы изучения различных профессий. В 1925 году при педагогическом отделе Института методов школьной работы была создана особая Тестовая комиссия, которая способствовала организации деятельности педагогов и психологов по разработке тестов для советской школы. На основе американских были разработаны тесты по счету, решению задач, на понимание чтения, на правописание, на знание географической карты.
Тесты сопровождались инструкциями по его проведению и выполнению заданий, а также личными карточками учета роста учебных достижений учащегося.
Под руководством П.П.Блонского осуществлялась проверка шкалы Бине-Симона, создание школьных тестов и построение стандартов. В Ленинградском научно- педагогическом институте им. А.И.Герцена и Детском обследовательском институте им.
А.С. Грибоедова разрабатывались тесты диагностики одаренности и тесты школьной успешности для массовых обследований детей нормальных школ.
Постановление ЦКВКП(б) «О педологических извращениях в системе Наркомпроса»
(1936) запрещает использование тестов в педагогической практике советской школы.
Тестология как наука и тестирование как метод измерения также прекращает свое существование в нашей стране на долгие годы.
Только в 60-е годы в дидактику возвращаются тесты (через систему программированного обучения). Однако следует отметить, что и в 40-60 годы тесты использовались, но в виде
«контрольных заданий», «самостоятельных работ», упражнений и т. п.
В 1970-1980 гг. резко критиковалась традиционная система контроля знаний. В бывшем
Советском Союзе развитие дидактической тестологии связано с работами Н.Ф. Талызиной по программированному обучению и В.П. Беспалько по проблемам педагогической технологии.
Отмечая, что учебные методы контроля пригодны для непосредственного общения учителя со школьниками на уроке по конкретным изучаемым на занятии вопросам, В.П.
Беспалько пишет, что для оценки качества знаний эти методы контроля не годятся, так как необходимые диагностичность, точность и воспроизводимость результатов в них не заложены. Аналогичными недостатками страдают и обычные письменные контрольные работы. Поэтому необходима специальная разработка материалов тестов, ориентированных на уровни решения тех или иных учебных задач. Сейчас такой подход разделяется многими педагогами.
В настоящее время в нашей стране появилось несколько центров, в которых профессионально занимаются работой с тестовыми технологиями. Среди наиболее активных следует отметить Центр тестирования Министерства образования Российской
Федерации, занимающийся тестированием выпускников общеобразовательных учреждений, Центр тестирования профессионального образования, Центр психологического и профессионального тестирования МГУ и целый ряд других.
4. Современное развитие тестологии
В 10-20 гг. ХХ века тестирование выходит за рамки научного эксперимента и превращается в массовое явление. Для упорядочения работы по разработке и использованию тестов создаются специальные организации и службы государственного уровня. В 1926 г. Совет колледжей США принял тест SAT и утвердил наборы заданий для профессиональной оценки деятельности педагогов.
В 1947 г. в США создается Служба тестирования в образовании (Educational Testing
Service), которая является и научно-исследовательским центром, и организацией, контролирующей проведение тестирования на всех уровнях образования в стране.
К 1961 году только в США были созданы 2126 стандартизированных тестов. Здесь существует множество тестовых издательств, общая продукция которых представляет несколько тысяч различных тестов.
Возникло новое направление педагогического тестирования - международные сравнительные исследования, с целью оценки качества образования различных стран.
Проведение международных исследований предоставляет странам возможность всесторонней оценки эффективности своих образовательных программ и сравнения подготовки своих учащихся с международными стандартами. Лидирующая роль в проведении подобных исследований принадлежит Международной ассоциации по оценке учебных достижений (IEA - International Association for the Educational Achievement) - независимой организации, объединяющей научные центры более 50 стран мира, и проводящей сравнительные исследования по оценке эффективности образовательных систем стран мира, осуществляющих различную политику в области образования. Первые исследования IEA проводились совместно с ЮНЕСКО. За 35 лет существования, начиная с 1959 года, IEA проведено более 15 исследований. Во многих странах мира результаты исследований IEA дали толчок или явились основой для проведения реформ в области образования.
Россия стала членом IEA в 1991 г. и с этого времени принимает активное участие во всех ее исследованиях (TIMSS - третьем международном исследовании по естественно-
математическому образованию, LES - исследовании по иностранным языкам и CIVIC - исследовании по социальным наукам).
Во второй половине ХХ века разрабатывается более совершенная модель анализа полученных результатов - современная теория тестов (IRT). В этот период теория тестов из описательной науки начинает превращаться в науку об отношениях, о законах функционирования и оценивания поведения испытуемых. Параллельно разрабатывались компьютерные программы для обработки тестовых результатов с помощью моделей IRT.
В середине 70-х гг. ХХ века разработаны новые критерии, предъявляемые к тесту как способу оценки качества:
адаптивность систем тестирования к качеству выводов испытуемых;
объективность педагогических измерений;
экономия ресурсов и времени проверок;
ограничение места для записи тестируемых заключений;
возможность применения различных форм предъявления тестовых заданий. В изложении темы использованы материалы курса лекций Ю.А. Воронина и др. [5].
Во второй половине ХХ века разрабатывается более совершенная модель анализа полученных результатов - современная теория тестов (IRT). В этот период теория тестов из описательной науки начинает превращаться в науку об отношениях, о законах функционирования и оценивания поведения испытуемых. Параллельно разрабатывались компьютерные программы для обработки тестовых результатов с помощью моделей IRT.
В середине 70-х гг. ХХ века разработаны новые критерии, предъявляемые к тесту как способу оценки качества:
адаптивность систем тестирования к качеству выводов испытуемых;
объективность педагогических измерений;
экономия ресурсов и времени проверок;
ограничение места для записи тестируемых заключений;
возможность применения различных форм предъявления тестовых заданий. В изложении темы использованы материалы курса лекций Ю.А. Воронина и др. [5].
1 2 3 4 5 6 7
Тема 7
ПСИХОЛОГИЧЕСКИЕ ТЕСТЫ: ТЕРМИНЫ
И ОПРЕДЕЛЕНИЯ. ПСИХОЛОГО-ПЕДАГОГИЧЕСКИЕ АСПЕКТЫ
ТЕСТИРОВАНИЯ
1. Понятийный аппарат тестологии
1.1. Понятие теста.
1.2. Надёжность и валидность теста.
1.3. Психологические аспекты тестирования.
1.1. Отечественная педагогическая тестология - очень молодая наука. В настоящий момент в различных изданиях по теории и практике тестирования можно встретить различное толкование и определение одних и тех же понятий, для обозначения одного явления может использоваться несколько синонимических терминов, основная группа терминов имеет иноязычное происхождение.
Термин «тест» (от англ. test - испытание, исследование) имеет в русском языке несколько значений (см. словарь иностранных слов). Но нас интересует только значение, которое используется в тестологии.
Существуют различные точки зрения при определении понятия «тест».
1) Тест - это инструмент, состоящий из квалиметрически выверенной системы тестовых заданий, стандартизированной процедуры проведения и заранее спроектированной технологии и анализа результатов для измерения качеств и свойств личности, учебных достижений, изменение которых возможно в процессе систематического обучения [8].
2) В.С. Аванесов предлагает различение теста как метода и теста как инструмента.
Тест как метод предполагает технологию измерения, которая включает в себя разработку системы тестовых заданий с заданными качественными и количественными характеристиками для объективного и надежного оценивания учебных достижений испытуемых, стандартизированную процедуру проведения тестирования, методы статистической обработки, анализа и интерпретации полученных результатов.
Тест как инструмент измерения определяется как система заданий (в большинстве случаев возрастающей трудности) специфической формы, позволяющая качественно оценить структуру и эффективно измерить уровень знаний, умений и навыков учащихся [1].
Слово «тест» в первом значении имеет научный аспект и используется учеными- тестологами, которые знают обо всех этапах разработки и применения теста, а также о теоретическом обосновании выбранных способов проверки и обработки полученных
результатов в соответствии с классической теорией тестов или современной теорией тестов.
Второе значение чаще возникает в практической области: в сознании тех, кто его использует или испытуемых, которые выполняют тест. Чаще используется именно второе значение. Но при этом надо помнить, что тест как измерительный инструмент является частью научного метода измерения (тестирования, теста) и соответственно должен отвечать ряду требований по его разработке, использованию и оцениванию результатов, которые определяются научными подходами.
1.2. Отличие тестов от других форм контроля.
1. Содержание теста подвергается четкому планированию. На стадии разработки теста происходит отбор содержания, которое будет подвергаться проверке, планируется форма заданий, их количество и расположение.
2. Форма заданий. В тестах форма заданий стандартизирована - по форме предъявления и по форме записи ответов.
3. Наличие статистических характеристик у тестовых заданий. Заранее известно, какова трудность предлагаемого задания, будет ли оно одинаково выполняться слабыми и сильными испытуемыми или нет (дифференцирующая способность) и др.
4. Наличие специальных шкал, которые соотнесены со стандартизированными нормами для подведения результатов тестирования.
5. Наличие оценок точности измерения (ошибки измерения). С помощью статистических методов мы можем оценить ошибку измерения, а по результатам оценки принять или не принять результаты тестирования.
Отличительные особенности теста определяют преимущества теста перед традиционными формами контроля учебных достижений: объективность, надежность, точность, экономичность измерений.
1.3. Тест, предъявляемый испытуемому, состоит из инструкции и тестовых заданий. В инструкции даются указания, из скольких частей состоит тест, какое количество времени дается на его выполнение, какой стратегии должен придерживаться испытуемый
(например, если не знаете ответ на задание, приступайте к выполнению следующего), что надо сделать, чтобы записать правильный ответ. Если тест включает различные формы заданий, то при смене форм, перед каждым субтестом дается дополнительная инструкция по выполнению данной формы задания.
Далее, после инструкции располагаются пронумерованные тестовые задания. Задания в тесте (субтесте), в соответствии с теорией тестирования, должны располагаться по нарастанию трудности, то есть в начало теста включаются легкие задания, потом более сложные.
Тест всегда сопровождается подробной инструкцией для организаторов и наблюдателей тестирования. Данная инструкция должна обеспечить равные условия для всех, кто выполняет тест. Поэтому в этой инструкции четко оговариваются условия тестирования
(требования, предъявляемые к помещению, где будет проходить тестирование, количество испытуемых в группе, время тестирования), форма заполнения тестовых бланков (данные испытуемого: имя, возраст, пол, школа и др.; как заносить правильные ответы и т. д.).
2. Надёжность и валидность теста
Основными показателями качества теста являются надежность и валидность теста. А так как тест является инструментом педагогического измерения, то эти показатели имеют численное значение и определяются с помощью различных методов как в классической теории тестов, так и в современной теории тестов.
Надежность - это характеристика теста, отражающая точность педагогического измерения, а также устойчивость результатов тестирования к воздействию посторонних
(случайных) факторов.
Второе значение чаще возникает в практической области: в сознании тех, кто его использует или испытуемых, которые выполняют тест. Чаще используется именно второе значение. Но при этом надо помнить, что тест как измерительный инструмент является частью научного метода измерения (тестирования, теста) и соответственно должен отвечать ряду требований по его разработке, использованию и оцениванию результатов, которые определяются научными подходами.
1.2. Отличие тестов от других форм контроля.
1. Содержание теста подвергается четкому планированию. На стадии разработки теста происходит отбор содержания, которое будет подвергаться проверке, планируется форма заданий, их количество и расположение.
2. Форма заданий. В тестах форма заданий стандартизирована - по форме предъявления и по форме записи ответов.
3. Наличие статистических характеристик у тестовых заданий. Заранее известно, какова трудность предлагаемого задания, будет ли оно одинаково выполняться слабыми и сильными испытуемыми или нет (дифференцирующая способность) и др.
4. Наличие специальных шкал, которые соотнесены со стандартизированными нормами для подведения результатов тестирования.
5. Наличие оценок точности измерения (ошибки измерения). С помощью статистических методов мы можем оценить ошибку измерения, а по результатам оценки принять или не принять результаты тестирования.
Отличительные особенности теста определяют преимущества теста перед традиционными формами контроля учебных достижений: объективность, надежность, точность, экономичность измерений.
1.3. Тест, предъявляемый испытуемому, состоит из инструкции и тестовых заданий. В инструкции даются указания, из скольких частей состоит тест, какое количество времени дается на его выполнение, какой стратегии должен придерживаться испытуемый
(например, если не знаете ответ на задание, приступайте к выполнению следующего), что надо сделать, чтобы записать правильный ответ. Если тест включает различные формы заданий, то при смене форм, перед каждым субтестом дается дополнительная инструкция по выполнению данной формы задания.
Далее, после инструкции располагаются пронумерованные тестовые задания. Задания в тесте (субтесте), в соответствии с теорией тестирования, должны располагаться по нарастанию трудности, то есть в начало теста включаются легкие задания, потом более сложные.
Тест всегда сопровождается подробной инструкцией для организаторов и наблюдателей тестирования. Данная инструкция должна обеспечить равные условия для всех, кто выполняет тест. Поэтому в этой инструкции четко оговариваются условия тестирования
(требования, предъявляемые к помещению, где будет проходить тестирование, количество испытуемых в группе, время тестирования), форма заполнения тестовых бланков (данные испытуемого: имя, возраст, пол, школа и др.; как заносить правильные ответы и т. д.).
2. Надёжность и валидность теста
Основными показателями качества теста являются надежность и валидность теста. А так как тест является инструментом педагогического измерения, то эти показатели имеют численное значение и определяются с помощью различных методов как в классической теории тестов, так и в современной теории тестов.
Надежность - это характеристика теста, отражающая точность педагогического измерения, а также устойчивость результатов тестирования к воздействию посторонних
(случайных) факторов.
Для оценки надежности нормативно-ориентированного теста используются две группы методов.
1. Двукратное тестирование:
– ретестовый метод;
– метод параллельных форм.
2. Однократное тестирование (метод расщепления теста).
Оценка надежности чаще всего строится на подсчете корреляции двух наборов результатов выполнения одного и того же теста или двух его параллельных форм. Чем выше корреляция, тем надежнее тест.
Ретестовый метод.
Данный метод оценки надежности предполагает двукратное проведение одного и того же теста в одной группе испытуемых. Повторное тестирование проводится примерно через 2-3 недели, чтобы учащиеся не слишком сильно забыли проверяемый материал и недалеко продвинулись в изучении нового, то есть уровень их учебных достижений остался примерно прежним.
Ретестовый метод основан на подсчете корреляции индивидуальных баллов испытуемых по результатам выполнения первого и второго тестирования.
Коэффициент надежности (коэффициент корреляции Пирсона):
-
Хорошим коэффициент надежности теста считается, когда показатель колеблется в пределах 0,8 < К < 1.
Данный метод оценки надежности не очень удобен в педагогических измерениях.
Временной фактор играет большую роль: временной промежуток не может быть большим
- изменится уровень учебных достижений учащихся, но и не должен быть слишком коротким - испытуемые могут помнить задания теста и ответы на них. И в том и в другом случае результаты измерения нельзя использовать для определения надежности теста.
Метод параллельных форм.
Метод параллельных форм предполагает двукратное тестирование одной и той же группы испытуемых тестами, которые идентичны по содержанию, структуре, включают задания тождественные по трудности, дифференцирующей способности и др., то есть параллельными формами теста.
Коэффициент надежности: x
i
– индивидуальный балл i-ого студента при ответе на тест X y
i
– индивидуальный балл i-ого студента при ответе на тест Y
N – число студентов
Главная трудность применения этого метода в том, что прежде чем использовать параллельную форму теста, разработчику надо создать новый тест, тождественный первому, и доказать идентичность, а это очень трудоемкая процедура. Поэтому этот метод, с практической точки зрения, малоэффективен.
Однократное тестирование (метод расщепления теста).
Этот метод удобен в практическом применении, так как ограничивается однократным тестированием. Метод расщепления теста основан на допущении параллельности двух половин теста и предполагает деление результатов тестирования на две части: данные по нечетным заданиям теста (Х) и по четным (У). Корреляция двух половин тестов возрастает по мере роста однородности (гомогенности) теста. Поэтому метод расщепления теста называют методом оценки внутренней согласованности и используют для определения гомогенности теста.
Коэффициент надежности вычисляется по формуле:
, где результат первого тестирования – это результаты по нечетным заданиям, а второго – по четным заданиям.