ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.08.2024
Просмотров: 741
Скачиваний: 0
СОДЕРЖАНИЕ
Часть 1 -содержательной стороне современной тестологии (особый инте-
Глава 1. Функции и происхождение
Глава 2. Природа психологических тестов
Глава 3. Социальные и этические аспекты
Глава 4. Нормы и интерпретация
Глава 10. Тесты для специфических
Глава II. Групповое тестирование
Часть 1. Классификация. Отметьте картинку, не принадлежащую трем остальным,
Часть 1. Вербальные способности. Каждое задание начинается с пары связанных
Часть II. Математические способности. Каждое задание содержит две величи-
мента с конкретной деятельностью и весов тех же самых элементов
в данном тестер Как выяснилось, J-коэффициент позволил повысить
шансы приема на работу представителей различных меньшинств и лиц
с низким образовательным цензом, поскольку он ориентирован на навы-
ки, существенные для выполнения работы (E.S. Prirnoff, 1975).
Иное использование синтетической валидности, особенно пригодное
для небольших фирм, в которых тот или иной вид работы выполняется
небольшим числом сотрудников, описано Р. М. Гюйоном (R. М. Guion,
1965). Исследование было проведено на предприятии со штатом из 48 со-
трудников, каждый из которых выполнял обязанности, отличные от обя-
занностей остальных. Детальный анализ этих обязанностей тем не менее
выявил 7 элементов, общих для многих видов работ. Каждому сотрудни-
ку давались оценки по всем элементам его деятельности, и эти оценки
сопоставлялись с его результатами по каждому тесту батареи профес-
сиональных качеств. На основе такого анализа для каждого вида работы
удалось синтезировать свою батарею, состоящую из двух тестов, наилуч-
ших с точки зрения их корреляции с элементами соответствующей дея-
тельности. Когда составленные таким путем батареи были проверены
при приеме 13 новых сотрудников, результаты оказались весьма обнаде-
живающими. Ввиду малого количества изученных случаев данные этого
исследования носят предварительный характер и лишь указывают на
возможность применения синтетической валидности.
Эти два примера синтетической валидности приведены единственно
с целью проиллюстрировать область применения данного метода.
Чтобы познакомиться с реальными процедурами, читателю следует
обратиться к первоисточникам. Итак, понятие <синтетическая валид-
ность> может быть использовано по-разному в зависимости от конкрет-
ной ситуации. Из него вырастает довольно многообещающий подход
к проблеме комплексного и непостоянного критерия; оно позволяет ком-
пановать тестовые батареи сообразно специфике работы и определять
валидность в условиях, когда адекватная валидность критерия практиче-
ски неосуществима. ,
КОНСТРУКТНАЯ ВАЛИДНОСТЬ
Конструктная валидность теста показывает, насколько его результаты
могут рассматриваться в качестве меры некоего теоретического кон-
структа или свойства. Примерами таких конструктов являются интел-
лект, понимание пространственных отношений, плавность речи, скорость
ходьбы, невротизм и тревожность. Будучи нацелена на широкие, устой-
" Сгатистическая обработка основана на применении уравнения множественной ре-
грессии (см. гл. 7). Для каждого элемента деятельности его корреляция с деятельностью
в целом умножается на его вес в тесте, и полученные произведения суммируются по всем
элементам деятельности.
141 ВЛЛИДНОСП.. OlIIOUHl.lh ПОНЯТИЯ
чивые и более абстрактные описания типов поведения, чем ранее рассмо-
тренные тины ва.лидностк, конструктная валидное ib предполагает посте-
пенное накопление информации из разных источников. В дело идут
любые данные, бросающие сеет на природу рассматриваемого свойства,
на условия, от которых зависит его развитие и проявление. Ниже обсу-
ждаются конкретные методы получения конструктной валидности.
Возрастные изменения. Главным критерием, используемым при
валидации ряда тестов интеллекта, является возрастная дифференциация.
Тесты типа Станфорд-Вине и большинство тестов для дошкольников
проверяются на фактический возраст с тем, чтобы выяснить, повышают-
ся ли тестовые результаты детей от года к году. Поскольку для детского
возраста характерно постоянное духовное и физическое развитие, резуль-
таты валидного теста также должны соответственно повышаться. Само
понятие возрастной шкалы интеллекта, по мысли А. Бине, исходит из то-
го положения, что <интеллект> растет по крайней мере до наступления
зрелости.
Критерий возрастной дифференциации, разумеется, неприменим
к таким функциям, которые не обнаруживают четких и постоянных воз-
растных изменений. В области тестирования личности, например, этот
критерий нашел ограниченное применение. Более тою, необходимо от-
метить, что возрастная дифференциация, даже когда она применима,
является необходимым, но не достаточным условием валидности. Иначе
говоря, если тестовые результаты нс улучшаются с возрастом, то это,
видимо, указывает на невалидность теста относительно умений, которые
он должен измерять. Вместе с тем, доказывая, что тест измеряет некое
свойство, совершенствующееся с возрастом, мы еще не очерчиваем до-
статочно точно область, охватываемую тестом. Измерение роста и веса
также с возрастом дает все более высокие результаты, однако оно никак
не является тестом интеллекта.
В заключение подчеркнем еще один момент, касающийся интерпре-
тации возрастного критерия. Психологический тест, валидность которого
установлена относительно такого критерия, измеряет поведенческие ха-
рактеристики, растущие с возрастом в условиях той среды, в которой
тест был стандартизован. Поскольку различные культуры могут стиму-
лировать развитие различных поведенческих характеристик, критерий
возрастной дифференциации нельзя считать универсальным. Как и все
другие критерии, он действителен лишь для определенной культурной
среды.
Анализ возрастных изменений играет большую роль в конструктной
валидации уже упоминавшихся в гл. 4 порядковых шкал Пиаже. Основ-
ной предпосылкой таких шкал является последовательность ступеней
развития, проявляющаяся н том, 410 развитие представлений, сложив-
шихся на ранних ступенях, служи т предпосылкой к овладению последую-
щими интеллектуальными операциями. Таким образом, содержанию
этих шкал присуща имманентная иерархичность. Конструктная валид-
ность порядковых шкал, следовательно, включасг эмпирические данные
об инвариантах носле;1.ова1сл1>пых ступеней развития. Это означает про-
верку выполнения теста детьми на разных уровнях развития данного
представления, скажем, постоянства или сохранения объекта. Нужно ли
убеждаться в том, что владение каким-то представлением на данном
уровне означает владение им и на более низких уровнях? Поскольку кри-
142 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
ствии с иерархичностью ступеней развития, их валидность также зависит
от эмпирической подтверждаемости данной иерархии.
Корреляция с другими тестами. Корреляция между новым
и аналогичными ему существующими тестами рассматривается как при-
знак того, что новый тест измеряет примерно ту же сферу поведения, что
и другие одноименные тесты, такие, как тесты интеллекта или тесты тех-
нических способностей и т.д. В отличие от валидности по критерию
здесь корреляция должна быть, но не слишком высокой. Если новый
тест слишком тесно коррелирует с уже существующим и не обладает
преимуществами в смысле краткости или легкости применения, то это
означает излишнее дублирование имеющегося теста.
Корреляция с другими тестами применяется, помимо этого, в каче-
стве меры независимости нового теста от влияния определенных посто-
ронних факторов. Например, тест специальных способностей или лич-
ностный тест должен обладать незначительной корреляцией с тестами
общего интеллекта или способности к обучению. Соответственно пони-
мание читаемого не должно заметно влиять на выполнение таких тестов.
Это объясняет, почему корреляции с тестами общего интеллекта, чтения
и понимания слов иногда приводятся как косвенное, или негативное, до-
казательство валидности. В этих случаях высокая корреляция ставила бы
под сомнение валидность теста. Однако низкая корреляция сама по себе
еще не гарантирует достаточной валидности. Нужно иметь в виду, что
этот способ использования корреляции с другими тестами аналогичен
одному из рассмотренных выше вспомогательных приемов валидации по
содержанию.
Факторный анализ. Прямое отношение к конструктной валидно-
сти имеет факторный анализ-статистический метод выделения психоло-
гических свойств. В сущности факторный анализ представляет собой усо-
вершенствованную технику анализа соотношений данных поведения.
Например, если 300 испытуемых пройдут 20 тестов, то первый шаг со-
стоит в вычислении попарных корреляций между всеми тестами. Провер-
ка полученной таким путем таблицы из 190 коэффициентов корреляции
уже может выявить коррелирующие между собой тесты, что означало
бы выделение общих для них свойств. Если такие тесты, как словарный,
синонимов, антонимов и завершения предложений, тесно коррелируют
между собой и слабо-с другими тестами, то мы могли бы выделить на-
личие общего им фактора-понимание слов.
Поскольку такой проверочный анализ корреляционной таблищд
и труден и ненадежен, то для выявления общих факторов, за счет ко-
торых можно объяснить полученные корреляции, применяются более
точные статистические методы. Эти методы будут еще рассмотрены
в гл. 13, где речь пойдет о комплексных батареях способностей, разра-
батываемых при помощи факторного анализа.
В ходе факторного анализа равное количеству тестов число пере-
менных или категорий, служащих для описания выполнения теста инди-
видом, сокращается до нескольких факторов или общих свойств. В при-
веденном выше примере для объяснения попарных корреляций между 20
тестами хватило бы 5-6 факторов. Иначе говоря, результаты каждого
индивида по 20 тестам можно было бы заменить данными по 5 или
6 факторам. Главное назначение факторного анализа состоит в упроще-
нии описания данных путем сокращения числа категорий до нескольких
143 ВАЛИДНОСТЬ. ОСНОВНЫЕ ПОНЯТИЯ
После идентификации факторов их можно использовать для описа-
ния факторного состава теста. Каждый тест может быть охарактеризо-
ван посредством основных факторов, определяющих его показатели, ве-
сом, или нагрузкой, каждого фактора и корреляцией теста с каждым из
них. Такая корреляция именуется факторной валидностью теста. Так, ес-
ли в словарном тесте фактор понимания слов имеет вес 0,66, то фактор-
ная валидность этого лексического теста как средства измерения пони-
мания слов равна 0,66. Важно отметить, что факторная валидность
представляет собой корреляцию теста с тем, что есть общего для группы
тестов или других указателей поведения. Анализируемое множество
переменных может, конечно, включать в себя как тестовые, так и внете-
стовые данные, в том числе субъективные оценки и другие крите-
риальные меры. Все они наряду с другими тестами могут быть исполь-
зованы для исследования факторной валидности конкретного теста и для
определения измеряемых им свойств.
Внутренняя согласованность. В описаниях ряда тестов, особен-
но тех, которые применяются для исследования личности, говорится, что
валидность теста была установлена методом внутренней согласованно-
сти. Существенной чертой этого метода является использование в каче-
стве критерия суммарного показателя данного теста. Иногда при этом
применяется метод сравнения контрастных групп, которые формируются
из испытуемых, показавших самые высокие и самые низкие суммарные
результаты. Выполнение каждого теста группой с высокими результата-
ми сравнивается с выполнением группой с низкими результатами, и те
задания, с которыми первая группа не справляется значительно лучше,
чем вторая, признаются невалидными и либо отбрасываются, либо пере-
сматриваются. Можно также воспользоваться бисериальной корреляцией
между исходами (<справился-не справился>) каждого задания и сум-
марным результатом теста, и тогда сохраняются только те задания, для
которых отмечена значимая корреляция с тестом в целом. Если тест со-
стоит из заданий, прошедших такого рода отбор, то говорят, что тест
обладает внутренней согласованностью, поскольку все его задания под-
чинены основному направлению теста как целого.
Критерий внутренней согласованности означает также корреляцию
между результатами субтеста и суммарным результатом. Многие тесты