ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.08.2024
Просмотров: 742
Скачиваний: 0
СОДЕРЖАНИЕ
Часть 1 -содержательной стороне современной тестологии (особый инте-
Глава 1. Функции и происхождение
Глава 2. Природа психологических тестов
Глава 3. Социальные и этические аспекты
Глава 4. Нормы и интерпретация
Глава 10. Тесты для специфических
Глава II. Групповое тестирование
Часть 1. Классификация. Отметьте картинку, не принадлежащую трем остальным,
Часть 1. Вербальные способности. Каждое задание начинается с пары связанных
Часть II. Математические способности. Каждое задание содержит две величи-
интеллекта, например, состоят из раздельно применяемых субтестов (та-
ких, как словарный, арифметический, завершение картинки и т.д.), из ре-
зультатов которых складывается общий результат теста. При построе-
нии таких тестов определяется корреляция между результатами каждого
субтеста с общим результатом и субтесты, плохо коррелирующие с те-
стом в целом, отбрасываются. Коэффициенты корреляции для оставших-
ся субтестов приводятся затем как свидетельство внутренней согласован-
ности всего теста.
Очевидно, что корреляции внутренней согласованности теста-суще-
ственная мера его однородности. Поскольку это свойство помогает оха-
рактеризовать область поведения или свойство, выборочно представлен-
ное в тесте, то степень однородности теста имеет отношение
к конструктной валидности. Тем не менее роль внутренней согласованно-
сти в валидности теста весьма ограничена. При отсутствии информации,
внешней по отношению к тесту, мало что можно сказать о том, что он
измеряет.
.-_-".""" "др""" д результаты
144 ПРИНЦИПЫ П(ИХ0.1(11ИЧ1.(К010 ТЕСТИРОВАНИЯ
теста. Еще одним источником данных о конструктной валидности мо-
гут служить эксперименты, в которых исследуется влияние тех или иных
факторов на результаты теста. При проверке валидности критериально-
ориентированного теста, предназначенного, скажем, для использования
в индивидуальном обучении, один из подходов состоит в сравнении ре-
зультатов тестирования до и после экспериментального воздействия.
Предполагается, например, что результаты до обучения должны быть
низкими, а после обучения - высокими. То же соотношение можно прове-
рить и на отдельных заданиях теста (W.J. Popham, 1971). В идеале
с каждым заданием до обучения должно справиться минимальное, а по-
сле обучения-максимальное число учеников. Задания, с которыми мало
кто справляется в обоих случаях, слишком трудны, а те, с которыми
справляются все и до и после обучения, слишком доступны с точки зре-
ния целей, преследуемых тестом. Если многие в первый раз справляются,
а во в горой раз не справляются с заданием, то что-то неладно или
с этим заданием, или с обучением, или с тем и другим.
Тест, предназначенный для измерения тревожности, можно испы-
тать, давая его испытуемым до и после того, как они были помещены
в обстановку, провоцирующую состояние тревоги (примером может слу-
жить проверка знаний в условиях, отвлекающих от проверки, и в стрес-
совой ситуации). Начальные тестовые показатели можно сопоставить
с физиологическими и иными показателями тревоги во время и после
экспериментального воздействия. Вместе с тем можно сравнить резуль-
таты тестирования до и после воздействия. Значимый прирост показате-
ля теста будет свидетельствовать о том, что он отражает текущий уро-
вень тревожности. Аналогичным образом можно построить эксперимент
на проверку теста относительно других измеряемых им свойств.
Конвергентная и дискриминантная валидности. В своем
глубоком анализе конструктной валидности Д.Т. Кэмпбелл
(D.T. Campbell, 1960) отмечает, что конструктная валидность теста зави-
сит не только от того, насколько тесно он коррелирует с другими пере-
менными, с которыми теоретически должен коррелировать, но и от от-
сутствия значимой корреляции с переменными, с которыми он не должен
быть связан. В более ранней работе Д.Т.Кэмггбелла и Д. В. Фиске
(D.T. Campbell, D.W. Fiske, 1959) эти процессы соответственно были на-
званы конвергентной и дискриминантной валидацией. Например, значи-
мая корреляция теста технических способностей с последующими оцен-
ками но курсу производственною обучения относится к конвергентной
валидности, тогда как дискриминант ной валидности отвечала бы низкая
и незначимая корреляция с пониманием читаемою текста, поскольку это
умение безотносигельно к icciy. предназначенному измерять технические
способное т и.
Напомним. 410 требование низкой корреляции с безотносительными
к тесту переменными рассматривалось выше в связи с дополнительными
процедурами валидацни по содержанию. Дискриминантная валидация
также имеет прямое отпопгенпс к определению валидности личностных
тестов, в которых безотносшельные к гесту переменные, причем разны-
ми путями, могут влиять на результаты.
В упомянутой выше сгатье (13. Т. Campbell. D.W. Fiske. 1959) предло-
жена схема эксперимента, позволяюгцею одновременно производить
конвергентную и дпскриминапгпую валидацию. названную ими много-
145
иЛЛИД11(Н1Ь. (KHOBHbIL ПОНЯТИЯ
гает оценку двух или более свойств двумя или более методами. Табл. 12,
взятая из этой сппьи, поясняет эту процедуру. На этой таблице изобра-
жены всевозможные корреляции показателей по трем свойствам, изме-
ряемым тремя методами. Эти свойства А, В и С могут обозначать со-
ответственно склонность к лидерству, общительность и мотивацию
достижений. В качестве методов могут выступать (1) опросник, который
испытуемый заполняет сам, (2) проективная методика и (3) оценки кол-
лег. Таким образом, А\ означает данные о стремлении к лидерству, по-
лученные с помощью онросника, л;-данные по тому же признаку, но на
основании проективного теста, а Сд-оценки мотивации достижений, да-
ваемые коллегами, и т.д.
Гипотетические коэффициенты корреляции, приведенные в табл. 12,
включают в себя коэффициенты надежности (они стоят в скобках вдоль
главной диагонали) и коэффициенты валидности (напечатаны полу-
жирным шрифтом но трем коротким диагоналям). Как показывают
коэффициенты валидности, результаты измерения каждого свойства раз-
личными методами коррелируют между собой. Здесь каждая мера сопо-
ставляется с другими независимыми мерами того же свойства, как и
в знакомой нам процедуре валидации. Таблица также содержит коэффи-
циенты корреляции между различными свойствами, измеренными одним
и тем же (сплошные треугольники) и разными (пунктирные треугольни-
Таблица 12
Гипотетическая миоюметодная матрица свойств (D.T.Campbell, D.W.Fiske, 1959, р. 82)
Мотод 1
Метод 2
Метод 3
свойства А B.i С.)
В, С, АЗ
0,89)
Метод 1 В<
.(0,76)
Ag 0,570,22 0,0910,93)
1
Метод 2 Bg 1 0,220,57 0,10
I -j
Ll -ЇU Ъ
0,22 0 1.0,670,42 0,33 1,94)
1 1
Метод 3 Вд 1 0,23 0,58 \ 0,12 \ \ 0,43" 0,660,34
1
0,11 0,110,45 [0,34 0,320,58
.(0,85)
146 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
ки) методами. Конструктная валидность может считаться удовлетвори-
тельной, если коэффициенты валидности явно выше коэффициентов кор-
реляции между различными свойствами, измеренными различными
методами. Они также должны быть выше коэффициентов корреляции
между различными свойствами, измеренными одним и тем же методом.
Например, корреляция между стремлением к лидерству, определенным
путем самооценки и проективным методом, должна быть выше, чем кор-
реляция между стремлением к лидерству и общительностью, найденным
по опросникам, заполняемым самим испытуемым. Если последняя кор-
реляция, представляющая дисперсию при фиксированном методе, была
бы высокой, то это могло бы означать, например, что на индиви-
дуальные результаты данного опросника заметно влияет такой безотно-
сительный к тесту фактор, как способность понимать вопросы или жела-
ние предстать в выгодном свете по всем свойствам.
Д. В. Фиске (D. W. Fiske, 1973) считает желательным дополнительно
воспользоваться еще одним множеством корреляций, особенно при кон-
структной валидности личностных тестов. Эти корреляции относятся
к измерению одного и того же свойства одним и тем же методом, но по-
средством разных тестов. Например, два исследователя могут независи-
мо друг от друга составить опросники выносливости, а результаты обо-
их опросников могут по-разному коррелировать с другими свойствами
личности. Если это происходит, то нельзя считать, что оба опросника из-
меряют один и тот же личностный конструкт-выносливость.
Добавим, что описанная выше матрица надежности указывает на со-
гласованность двух мер одного и того же свойства, полученных предель-
но сходными методами, такими, как параллельные формы теста; на ва-
лидность между двумя мерами одного свойства, полученными предельно
различными методами, например с помощью теста и посредством опро-
са мнений коллег. Поскольку сходство и различие методов могут про-
являться в разной степени, теоретически надежность и валидность могут
рассматриваться как принадлежащие одному и тому же континууму. Од-
нако, как правило, методы, используемые для измерения надежности
и валидности, легко различимы.
итоги
Мы рассмотрели несколько способов задавать вопрос: <Насколько
валиден данный тест?> Чтобы четче выделить отличительные черты раз-
ных типов валидности, применим каждый из них к тесту, состоящему
из 50 различных арифметических задач. В табл. 13 отражены 4 способа
использования данного теста и соответствующие им процедуры валида-
ции. Из таблицы видно, что выбор процедуры валидации зависит от
последующего назначения результатов теста. Валидность одного и того
же теста в зависимости от цели его применения должна устанавли-
ваться по-разному. Если тест достижений используется для предска-
зания дальнейших успехов на более высоком уровне обучения, как в слу-
чае отбора старшеклассников при их приеме в колледж, то валидность
этого теста нужно устанавливать относительно оценок, получаемых
в колледже, а не относительно содержания данного школьного курса.
Примеры из табл. 13 поясняют различия между разного типа ва-
лидациями. Дальнейшее рассмотрение этих процедур, однако, показы-
вает, что валидности по содержанию, относительно критерия и конструкт-
ная ре являются строго различными или логически упорядоченными
147 ВАЛИДНОСТЬ. ОСНОВНЫЕ понятия
Таблица 13
Валидность одного и того же арифметического теста применительно к разным целям
Цель тестирования Вопрос) на который должен Тип валидности
ответить тест
Тестирование достижений по Что Дик усвоил на По содержанию
арифметике в средних классах сегодняшний день?
школы
Тестирование способностей для Как Джим будет Прогностическая
предсказания возможности освоения учиться в дальнейшем? относительно критерия
курса математики в старших
классах
Диагностирование трудностей Выявило ли выполнение Текущая относительно
в обучении теста Биллом какие-то критерия
трудности в обучении?
Тестирование логического Как можно охарактери- Конструктная
мышления зовать психическую
деятельность Генри?
категориями. Напротив, конструктная валидность-широкое понятие,
включающее другие типы валидности. Все обсуждавшиеся выше конкрет-
ные методы установления валидностей по содержанию или относитель-
но критерия можно было рассматривать в разделе конструктной валид-
ности. Сравнение показателей двух групп, скажем невротиков и здоро-
вых, является способом проверки конструктной валидности теста, на-
правленного на измерение эмоциональной устойчивости, тревожности и
других свойств личности. Сравнение показателей глубоко умственно от-
сталых и нормальных школьников-это способ исследования конструкт-
ной валидности теста интеллекта. Корреляция теста технических спо-
собностей с успешностью обучения на специализированных курсах и с
выполнением различного рода работ позволяет нам лучше понять
конструкт, измеряемый тестом. Валидность относительно разнообразных
практических критериев обычно приводится в руководствах к тесту с
тем, чтобы будущему его пользователю легче было узнать, что изме-
ряет тест. Даже не будучи заинтересован в предсказании использован-
ных критериев, он по их списку сможет составить себе представле-
ние об области поведения, выборочно представленной в тесте.
Точно так же валидность по содержанию играет важную роль как
при построении, так и при последующей оценке всех тестер. Подбирая
задания для любого нового теста, составитель руководствуется неко-