ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 06.08.2024

Просмотров: 717

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

торыми гипотезами относительно соотношения между выбираемым ти-

пом содержания и поведением, которое он намерен измерять. Все спо-

собы валидации критерия, в том числе обсуждавшиеся в конструктной

валидности, служат инструментом проверки таких гипотез. Что касается

пользующегося.тестом, то при оценке теста ему не следует слишком по-

лагаться на валидностьпо содержанию. Например, при проверке словар-

ного состава опросника эмоциональной устойчивости с точки зрения до-

ступности его для тех, кого намечается тестировать, он может

обнаружить, что результаты определенного теста слишком зависят от

скорости работы испытуемого или что в тесте интеллекта, разработан-

ном 20 лет назад, слишком много устаревших заданий. Все такие нябтттп-

148 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

ста. Собственно говоря, нет таких сведений, получаемых в ходе любой

процедуры валидации, которые бы ни имели отношения к конструктной

валидное ти.

Официально термин <конструктная валидность> был введен в психо-

метрию в 1954 г. в <Методических указаниях по психологическим тестам

и диагностике>, являющихся первым изданием ныне действующих

<Норм> Американской психологической ассоциации (Standards..., 1974).

Хотя процедуры, отнесенные к разряду конструктной валидации, в то

время были уже не новы, последовавшее затем обсуждение конструктной

валидности способствовало уточнению формулировок и систематическо-

му обоснованию данного подхода. Понятие конструктной валидности

позволило подчеркнуть роль психологической теории в разработке те-

стов и необходимость формулировать гипотезы, подлежащие подтвер-

ждению или опровержению в процессе валидации. Это особенно важно

при опенке тестов, предназначенных для научных изысканий.

В практическом плане это понятие оказалось полезным при изуче-

нии валидности критериальных мер, применяемых в традиционной вали-

дации по критерию (L.R.James. 1973). Анализируя корреляцию раз-

личных критериальных мер между собой и с другими относительными

переменными, проводя факторный анализ таких данных, можно больше

узнать о значении того или иного критерия. В некоторых случаях резуль-

таты такого исследования приводят к перестройке или замене критерия,

выбранною для валидации теста. Так или иначе они обогащают интер-

претацию данных о валидности теста.

Конструктная валидность находит также практическое применение


в ситуациях, когда валидация по критерию невозможна, например при

определении локальной валидности тестов для отбора персонала на про-

мышленные предприятия. Выше, при обсуждении синтетической валид-

ности, уже говорилось о возникающих в этом случае трудностях. Кон-

структная валидность подсказывает еще один способ преодоления этих

трудностей при оценке применимости существующих тестов к опреде-

ленному виду работ. Как и при построении синтетической валидности,

этот подход предусматривает проведение систематического анализа типа

работы, после чего квалификация выполняющего ее работника описы-

вается в терминах конструктов соответствующего поведения. Далее, если

тест до своей публикации прошел необходимые исследования, то сведе-

ния, пршюдпмые в руководстве к нему, позволяют очертить основные

коне) рук ii.i, измеряемые тестом. Если они явно совпадают с теми, ко-

торые 1п.1лс,к:<1 измерению, то указанные сведения дают возможность

пепосрсдч псине оценить соответствие теста функциям, осуществляемым

при данном циде работ. В противном случае с их помощью можно рас-

СЧ111.П1, ./конфициент или иной количественный показатель синтетиче-

ской палндноии.

Коне 1 рук тая валидность также стимулировала поиски новых путей

получения палидациоппых данных. Хотя основные методы исследования

коне 1 рук iiioii иалидностп уже давно известны, к ним присоединяются все

новые и HOIII.IC процедуры. Однако многочисленность методов сбора

данных lain в себе определенные опасности. Может случиться, что со-

ciai<iiic.iii> iccia перепробует большое количество различных валида-

1ц-Ю1нн>1\ процедур, небольшая часть которых случайно даст положи-

-.......". ., nniluT о них. не упоминая тех, что

149 ВАЛИДНОСТЬ. ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ

вое впечатление. Другая возможная опасность кроется в том, что термин

<конструктная валидность> иногда отождествляют с субъективными не-

проверенными утверждениями относительно валидности теста. Посколь-

ку конструктная валидность является столь широким и расплывчатым

понятием, ее часто истолковывают неправильно. Некоторые авторы

учебников и тестов, видимо, воспринимают ее как валидность по содер-

жанию, представленную на языке психологических категорий. В резуль-

тате они выдают за конструктную валидность чисто субъективные рассу-

ждения о том, что, по их представлениям, измеряет тест.


Еще один источник возможных недоразумений коренится в утвер-

ждении, что конструктная валидация <применяется, когда тест подлежит

интерпретации в качестве меры свойства или качества, не поддающегося

операциональному определению> (L.J.Cronbach, P.E.Meehl, 1955,

р. 282). Поскольку эта формулировка содержится в первом появившемся

в печати детальном анализе конструктной валидности, ее ошибочно

принимают за обоснование необходимости пользоваться конструктной

валидностью за неимением иных данных. То, что авторы этой формули-

ровки не имели в виду ничего подобного, говорит следующая фраза из

той же статьи: <прибегать к конструктной валидности бессмысленно, ес-

ли теоретические построения никак не согласуются с наблюдениями>

(ibid, р. 291). В этой же связи они критикуют тесты, <валидация которых

подменена логическими хитросплетениями> (ibid, р. 291). В самом деле,

измеряемый тестом теоретический конструкт, свойство или область по-

ведения можно адекватно определить только в свете данных, собранных

в процессе его валидации. Такое определение должно учитывать пере-

менные, с которыми тест значимо коррелирован, условия, реально

влияющие на его результаты, а также то, какие группы тест значимо

дифференцирует. Эти процедуры находятся в полном согласии с тем по-

ложительным, что пришло в тестирование вместе с понятием <кон-

структная валидность>. Только эмпирическое исследование соотношений

между тестовыми показателями и другими внешними данными позво-

ляет выяснить, что измеряет тест.


Глава 7. Валидность.

ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ

Гл. 6 была посвящена различным понятиям валидности и тому, как они

соотносятся с тем или иным назначением теста. В этой главе обсу-

ждаются способы количественного выражения валидности и интерпрета-

ция получаемых результатов. Пользующийся тестом обращается к ва-

лидности в следующих двух случаях. Первый раз, оценивая пригодность

теста для своих целей, он изучает данные о валидности, приведенные

в руководстве к тесту или в других доступных источниках. На основе

этой информации он получает представление о том, какие психические

функции тест измеряет, и решает, соответствуют ли такие функции це-

лям его использования теста. В этом случае, полагаясь на опублико-

ванные данные о валидности теста, пользователь, какие бы конкретные

процедуры при сборе таких данных ни применялись, имеет дело с кон-

структной валидностью. В гл. 6 уже отмечалось, что критерии, употре-

блявшиеся в опубликованных исследованиях, не обязательно идентичны

тем к-пт-ппые ппгттуюптайся тестом собипается ппогнозиповать. Лаже

150 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

одноименные должности на двух различных предприятиях редко совпа-

дают по своим обязанностям, точно так же, как два курса английского

языка в разных колледжах могут значительно отличаться друг от друга.

Ввиду специфичности каждого критерия, пользователю обычно реко-

мендуется проверить, если возможно, валидность выбранного теста от-

носительно локального критерия. Даже когда опубликованные данные

явно указывают на высокую валидность теста в частной ситуации, всегда

желательно их непосредственное подтверждение. При определении ва-

лидности относительно конкретных локальных критериев пользующийся

тестом оценивает его валидность второй раз. Методы, рассматриваемые

в этой главе, имеют непосредственное отношение к анализу данных ва-

лидации, получаемых самим пользователем теста, но их также можно

использовать (по крайней мере большую их часть) для понимания и ин-

терпретации сведений о валидности, приводимых в руководствах

к тестам.

КОЭФФИЦИЕНТ ВАЛИДНОСТИ И ОШИБКА ПРОГНОЗА

Измерение с оотношени я.; Коэффициент валидности есть корреляция

между показателями теста и критериальной мерой. Этот коэффициент


позволяет характеризовать валидность единственным показателем,; и по-

этому его часто приводят в руководствах к тестам, сообщая его значение

для каждого из использованных критериев. Данные, по которым вычис-

ляется коэффициент валидности, можно также представить в форме про-

гностической таблицы или карты прогноза (см. гл. 4, табл. 6, рис. 7).

Собственно говоря, такие таблицы и карты-наглядные иллюстрации то-

го, что коэффициент валидности означает для тестируемого индивида.

Напомним, что на карте прогноза приводится вероятность для испытуе-

мого, показавшего определенный результат, достижения определенного

уровня критериального выполнения. Например, с помощью табл. 6

(гл. 4, с. 96), зная результат ученика по тесту словесного мышления ба-

тареи DAT, можно определить вероятность получения им той или иной

оценки по тому или иному учебному предмету. Согласно этим данным,

коэффициент валидности такого теста равен 0,66. Если, как в приведен-

ном примере, тестовые и критериальные переменные-континуальны, то

применим уже знакомый нам коэффициент корреляции произведения мо-

ментов Пирсона. Если же исходные данные выражены в различной фор-

ме (скажем, когда критериальные переменные имеют значение <выполне-

но-невыполнено>-см. рис. 7, гл. 4), то коэффициенты корреляции

вычисляются иными методами. Конкретные процедуры вычислений

можно найти в любом учебнике по статистике.

Условия, влияющие на коэффициент валидности. Как и

в случае надежности, необходимо точно определить характер группы,

для которой найден коэффициент валидности. Один и тот же тест может

измерять различные функции, если его дать лицам разного возраста, по-

ла, образовательного уровня, рода занятий и т. д. Имея различный опыт,

испытуемые, например, могут по-разному подойти к решению одной

и той же задачи. Следовательно, тест может обладать высокой валид-

ностью относительно некоторого критерия в одной популяции и низкой

или нулевой валидностью-в другой. Он может также измерять разные

(ЬУНКЦИИ В ОаЗНЫХ ПОПУЛЯТТИЯХ ПпчтпУ w-nw паттигтаттипчнаа тп-тйпгнга uf

151 ВАЛИДНОСТЬ. ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ

репрезентативна для популяции, в которой предполагается использовать

тест, валидность необходимо определить заново на соответствующей

выборке..

/ Разнородность выборки имеет для измерения валидности такое же

значение, как и для измерения надежности, поскольку обе характеристи-