ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 06.08.2024

Просмотров: 723

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

обходимо, чтобы результаты геста не сказывались на определении дей-

ствительного (критериального) статуса, индивида. Например, если препо-

давателю колледжа или мастеру на заводе известно, что данный студент

или рабочий плохо сппачялся -с соответствующим тестом способностей,

то это может плохо ск:-?аться на оценке их деятельности. И наоборот,

если некто получил по этому тесту слишком высокие результаты, то

подобное влияние, очеш-цно, могло бы привести к искусственному завы-

шению корреляции между результатами теста н критериальным поведе-

нием.

Это явление на~ъгаа.ется контаминацией критерия. Чтобы его пре-

дотвратить, совершеьн.- необходимо, чтобы лицам, производящим кри-

териальную оценку, ничего не было известно о тестовых результатах ис-

пытуемого. По эой причине тесгогые результаты обследуемого

держатся в строгом секрете. Норой трудно убедить преподавателей, ад-

министрацию учреж 1,ения военное начальство и других лиц в важности

этой меры. -Желая немедленно использовать полученную информацию

133 ВАЛИДНОСТЬ. ОСНОВНЫЕ ПОНЯТИЯ

трогать до тех пор, пока не будут получены критериальные данные, по

которым можно определить его валидность.

Общие критерии. Для валидации теста можно использовать

самые разнообразные критерии. Любой метод оценки поведения в лю-

бой ситуации мог бы стать источником критериальной меры для той

или иной цели тестирования. Однако критерии, на основе которых опре-

деляются значения валидности, приводимые в руководствах к тестам,

можно разбить на несколько основных категорий. Для валидации тестов

интеллекта чаще всего используется тот или иной показатель успеваемо-

сти. Вот почему такие тесты иногда называют тестами способности

к обучению. Их критериальной мерой служат школьные оценки, данные

тестов достижений, сведения о переводе в следующий класс и об оконча-

нии школы, особые отличия и поощрения, мнение учителей об интеллек-

туальном уровне ученика. Поскольку на такие субъективные оценки в ос-

новном влияет выполнение ребенком своих ученических обязанностей, их /

вполне можно отнести к разряду показателей успеваемости.

Показатели успеваемости могут играть роль критериальных данных

на всех уровнях обучения-от младших классов школы до колледжа и ас-

пирантуры. Хотя их используют главным образом для валидации тестов

общего интеллекта, они также выступают в качестве критерия некоторых


личностных тестов и комплексных батарей способностей. При валидации

тестов, предназначенных для отбора абитуриентов, общим критерием

является средний балл первокурсника.

Разпови.цюси.ю кршгрия ин-шжспин в поучении л.1Я неучащихся

взрослых являегся ооьсм iio.iylciiiion) ими оораюнипия. При тюм пред-

полагается, что более развитые индивиды продолжают свое образование,

а менее развитые прекращают его. Хотя не подлежит сомнению, что,

скажем, выпускники колледжа составляют более развитую группу, чем

окончившие лишь восемь классов общественной школы, соотношение

между объемом образования и способностью к обучению отнюдь не

однозначно. Факторы, не относящиеся к imic.iJicKiyaJibiioMy развитию,

такие, как экономические, социальные, мотивационные и другие, особен-

но сказываются на продолжении различного уровня высшего образова-

ния. Более того, при такой текущей валидации трудно решить, что

является причиной, а что следствием. В какой степени полученные разли-

чия в тесте интеллекта есть просто результат разницы в образовании?

Насколько точно тест мог бы предсказать индивидуальные различия

в успехах при дальнейшем обучении? На эти вопросы удается ответить,

только когда тест проводится до получения критериальных данных, как

при предсказательной валидности.

При разработке тестов специальных способностей роль критерия ча-

сто играют результаты специальной подготовки. Например, валидность

тестов технических способностей устанавливается по конечным результа-

там профессионального обучения. Критерием могут служить результаты

окончания курсов стенографии, машинописи, бухгалтерского дела и т.д.

Валидация тестов музыкальных или художественных способностей про-

водится по успехам в музыкальных и художественных школах. Для ряда

тестов профессиональных способностей была проведена валидация отно-

сительно достижений в юридических, медицинских и высших технических

учебных заведениях. Результаты обучения часто являются источником

-- .,".".... "".."", г.г,г.тттт п т-от-ov гтгписпичириняу ППЯ ИГТЮПТОВЯНИЯ

134 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

служит валидация тестов для отбора слушателей на курсы военных лет-

чиков по результатам первичной летной подготовки. Выполнение про-

граммы специального обучения обычно используется и при валидации

других тестов, предназначенных для отбора военных и промышленных


специалистов.

Среди показателей выполнения программы обучения, используемых

в качестве критерия, могут быть уже упоминавшиеся тесты достижений,

проводимые по завершении курсов, официально присвоенная квалифика-

ция, оценки инструкторов и успешное завершение курсов или отчисление

из них. Валидность комплексных батарей способностей часто устанавли-

вается по оценкам, получаемым по специальным предметам, прохо-

димым в школе или в колледже. Например, результаты теста понимания

слов сравниваются с оценками по английскому языку, данные теста про-

странственной визуализации с оценками по геометрии и т.д.

В связи с использованием данных профессионального обучения как

критериальной меры полезно различать промежуточные и конечные кри-

терии. Применительно к тесту отбора военных летчиков или к тесту ме-

дицинских способностей, например, конечными критериями будут со-

ответственно выполнение боевых заданий и врачебная практика.

Очевидно, для получения таких данных потребуется много времени. Со-

мнительно к тому же, что такой критерий действительно является ко-

нечным. Наконец, даже если бы такие конечные данные удалось полу-

чить, на них, вероятно, сказывалось бы действие многих не поддающихся

контролю факторов, что снижало бы ценность результатов. Так, трудно

было бы оценить относительную степень успеха врачей разных специаль-

ностей в различных частях страны. Поэтому в качестве критериальных

мер часто используются промежуточные критерии.

Наилучшие во многих отношениях критериальные меры основаны

на последующем выполнении реальной деятельности. Они отчасти ис-

пользовались при валидации тестов общего интеллекта и личностных те-

стов, но в основном-при валидации тестов специальных способностей.

Они также применяются при валидации тестов профессионального отбо-

ра в торговле, промышленности, армии. Большинство мер, основанных

на выполнении деятельности, хотя и являются конечным критерием, все

же во многих отношениях хороши и как промежуточные критерии.

В этом качестве они предпочтительнее данных о прохождении специаль-

ного обучения. Вместе с тем при измерении выполнения той или иной

деятельности не удается в такой степени стандартизовать условия изме-

рения, как в случае профессионального обучения. Более того, поскольку

выяснение уровня выполнения деятельности занимает много времени,


оно сопряжено с выбыванием значительного числа испытуемых. Ввиду

того что лица, занимающие номинально одинаковые должности, в раз-

ных организациях выполняют фактически неодинаковые функции, в ру-

ководстве к тесту необходимо приводить сведения не только о валидно-

сти данных по критерию деятельности, но и об обязанностях,

выполнявшихся членами нормативной выборки.

Валидация методом контрастных групп обычно влечет за собой

сложный критерий, в котором отражены накапливающиеся и неконтро-

лируемые избирательные влияния повседневной жизни. Такой критерий

в конечном счете связан с принадлежностью или непринадлежностью ин-

ливила к оппепйлйннпй гпл/ттшэ Маттмтичо. г.., "п",.~---. ----- - - --

135 ВАЛИДНОСТЬ. ОСНОВНЫЕ ПОНЯТИЯ

ставлены с результатами нормальных школьников того же возраста.

В этом случае множество факторов, определивших помещение ребенка

в специальное учреждение для детей с глубокой умственной отста-

лостью, составят критерий валидации. Аналогично валидность теста му-

зыкальных или технических способностей проверяется сравнением ре-

зультатов учащихся музыкальной школы или инженерного колледжа

с данными учеников обычной школы или обычного колледжа.

Разумеется, контрастные группы могут комплектоваться по любому

критерию-по успеваемости, субъективному мнению о качествах лично-

сти, выполнению деятельности или просто по признаку предельных слу-

чаев в каком-либо распределении критериальных мер. Эти группы стано-

вятся различными постепенно под действием многочисленных требова-

ний повседневной жизни. В этих условиях критерий оказывается

сложнее ранее рассмотренных и не поддается четкому определению.

Метод контрастных групп весьма часто применяется при валидации

личностных тестов. Так, определяя валидность теста социальных качеств,

можно сопоставить результаты тестирования торговых и администра-

тивных работников с данными конторских служащих и инженеров. При

этом предполагается, что работающие в торговле или управленческом

аппарате превосходят по своим социальным качествам инженеров

и клерков. Точно так же можно сравнить самых активных и наименее ак-

тивных студентов колледжа. При валидации тестов интересов, таких, как

анкета основных профессиональных интересов (SVIB), и при подготовке

шкал социальных установок часто используются данные разных профес-


сиональных групп. Для определения валидности шкал социальных уста-

новок иногда используются также группы, сформированные по полити-

ческому, религиозному, географическому и иным признакам, поскольку

эти группы представляют явно различные точки зрения.

При разработке некоторых личностных тестов, как отбор заданий,

так и валидация, основываются на врачебном диагнозе. Такой диагноз

допустимо использовать как достаточный критерий, если он ставится по-

сле длительного наблюдения и детального изучения истории болезни,

а не после поверхностного собеседования или осмотра. В последнем слу-

чае на врачебный диагноз можно положиться не больше чем на резуль-

тат самого теста, и такой диагноз следует рассматривать не как крите-

риальную меру, а как результат, валидность которого еще должна быть

установлена.

В связи с другими категориями критериев уже упоминались субъек-

тивные оценки, даваемые школьными учителями, инструкторами специа-

лизированных курсов, мастерами на производстве. Сюда же относятся

отзывы офицеров о подчиненных им военнослужащих, оценки, даваемые

ученикам школьной администрацией, оценки товарищей по работе, по

классу, по клубу и т.д. До сих пор речь шла о субъективных оценках,

играющих лишь вспомогательную роль в получении информации о та-

ком критерии, как академическая успеваемость, обучение на специализи-

рованных курсах, успехи в работе. Теперь же рассмотрим применение

субъективных оценок в качестве основной критериальной меры, особенно

когда такие оценки не ограничиваются описанием конкретных достиже-

ний, а являются мнением наблюдателя по целому ряду свойств, на изме-

рение которых ориентирован тест. Например, испытуемые из выборки

--_".."" " -хапактеоистики по таким признакам, как стремле-

- Т,ТТТ1 чстнпсть.

13о ПРИНЦИПЫ 11ихо..к)гич1-(к()го ТЕСТИГПЛНИЯ

Подобные оценки используются при валидации почти всех типов те-

стов. Они особенно важны в качестве критерия личностных тестов, по-

скольку в этой области трудно установить более объективные критерии.

Это особенно справедливо в отношении социальных качеств, оценка ко-

торых основывается на личных контактах и составляет наиболее ло-

гичный их критерий. Хотя эти оценки подвержены ошибкам, свой-

ственным всем субъективным суждениям, они представляют значитель-

ную ценность, если условия, в которых производится регистрация