ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 06.08.2024

Просмотров: 730

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

указания и степень согласия между ними. Поскольку программы и со-

держание курсов со временем меняются, особенно желательно указать

дату обращения к экспертам. Следует также сообщить число и характер

изученных программ и учебников и привести годы их издания.

Эти сведения могут быть дополнены рядом эмпирических процедур.

Так, можно проверить, насколько от класса к классу повышается сум-

марный показатель и индивидуальное выполнение теста достижений.

В общем, сохраняются те задания, которые выполняются наибольшим

(вЇо) числом учеников. На рис. 14 приведен фрагмент таблицы из руко-

водства к последовательным тестам успехов в обучении, серия It (STEP).

Для каждого задания этой батареи достижений указан процент детей из

нормативной выборки, справившихся с ним в каждом из классов, для ко-

торых предназначен данный уровень теста, а также тип учебного навыка

и материала. 30 заданий из рис. 14 составляют лишь часть теста чтения

для 3-го уровня (VII-IX классы).

Помимо сказанного анализируются типичные ошибки испытуемых

и применяемые ими методы работы. В последнем случае тестирование

ведется в индивидуальном порядке, причем ученика просят при решении

каждой задачи <думать вслух>. Существенность скоростного фактора

контролируется по количеству испытуемых, не успевающих закончить

тест, или с помощью одного из более тонких методов, обсуждавшихся

в гл. 5. Для выявления возможного влияния способности читать ин-

струкции на выполнение теста показатели теста можно скоррелировать

с результатами теста на понимание прочитанного. В свою очередь, если

тест предназначен для оценки понимания текста, вопросы, относящиеся

к содержанию еще не прочитанного отрывка, покажут, насколько испы-

туемый в состоянии на них ответить, исходя из имеющихся у него пред-

варительных сведений или пользуясь разными косвенными данными.

Область применения. Валидность по содержанию, особенно если

Она ТТОПКпсТтгтрня rraulii-inJTJ тт>гт<1гтт1<., ,,г.п...,..-- ",,...> ""-.."".-_

129

вллидшкть. <tHOBHbll- понягия

bHHBtfBE Ni- мго)- ir)u3toociо т- <MfoT in10 tcOCn От-"~ IN <MIMNTJ-СМ С (Nin 10 c. IN CM CMCO 0) 0 см смго

! OJOHhABH оноивипоэ

OJOHhABHOH -HagJoalaa

1 L 1OJOHhABH-OH -dBiMHBIMAJX XX

OJOHHae -i33<offAxХX X

1 о 1 1OJOHhAaH ончивиоэX XХ

OJOHhAeKOH -нэа1Эв1эвX XХX XX

OJOHhAeH-OH -delHHewAJ

5OJOHHag -1ЭЭЖо1ГАхXX X

e x ? S 1 <в 1OJOHhAeH онч1геиТ103X

OJOHhAeHOH -нэа10Э1эаXХ ХXX X

OJOHhABH-ОН -delHHeiMAJXXXi


OJOHHag -1ээжоИАхХX

5? иээвих xiсо <М 0 00 Їо<оLf) РОО t1- см - iin(мГ <о co<T изго <о t-lt 1t. т- 00 MtO Tt. LHOO r-intT) СМ 01 ~ 00 0CM CO 10 in <NfOpr> CMO -1-

ээе"х 111Лп 1- т со [ in<D М-1-М (OJ"1 00 иэ из мг<а-г m .T<?>в? осп io с из(N 0<M C in -ftno ro РОЮоо изГ 1) C-IO0 ПЭ in IN CMCM >o 0 г<п fn tr)

зови> 11Л[-> Т-СТ1 [ иэгМ 0-in 1Л гпen Ti-in <мГво 0 w tor inсп 0 со in 10 in-т-[ cr юoo i- in см мчГIN inT ro 10 inЇ0 en (N 4- -<-Mшспт IN CM CM

UHHBtfBC N сч fn in 10t оост>0- <мгс t in101 COет> От-~ мсмм PO r CM <N CMIn (01 CM CM CM(ОСЛО (N CM fn

РИС. 14. Данные no вопидности содержания, на примере числа заданий классифика-

ционной таблицы из программы STEP (серия II тестов чтения уровня 3 для VII-IX клас-

сов).

130 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

адекватным средством оценки тестов достижений. Она позволяет устано-

вить, охватывает ли тест репрезентативную выборку конкретных навы-

ков и знаний и свободно ли выполнение теста от влияния посторонних

факторов.

Валидность по содержанию особенно подходит к критериально-

ориентированным тестам, описанным в гл. 4. Поскольку выполнение те-

ста оценивается в этом случае с точки зрения усвоенного материала

и навыков, в первую очередь необходимо, чтобы эти тесты были ва-

лидны по содержанию. Данный тип валидности применим и к неко-

торым тестам, предназначенным для отбора и распределения профессио-

нальных кадров, о чем речь пойдет в гл. 15. Валидность по содержанию

можно использовать также, когда тест представляет собой выборку дей-

ствительных рабочих операций или иным путем связан с профессио-

нальными навыками и знаниями. В таких случаях необходимо выяснить,

имеет ли место близкое сходство между профессиональной деятель-

ностью и содержанием теста.

Вместе с тем в личностных тестах и теЪтах способностей валидность

по содержанию обычно не применяется. Правда, анализ релевантности

и эффективности содержания обязателен на начальных стадиях составле-

ния любого теста, но валидность тестов способностей и личностных те-

стов должна проверяться эмпирическими методами, о которых будет

сказано ниже. Эти тесты не имеют того внутреннего сходства с иссле-

дуемыми областями поведения, какое присуще тестам достижений, сле-

довательно, анализ их содержания может разве что выявить гипотезы,

приведшие составителя к выбору определенного материала для измере-

ния тех или иных особенностей личности. Чтобы установить валидность

подобных тестов, необходимо эмпирически подтвердить эти гипотезы.


В отличие от тестов достижений тесты способностей и личностные

тесты не связаны с конкретным курсом обучения или с общностью пред-

шествующего жизненного опыта, на которых строится содержание теста

достижений. Способы выполнения заданий тестов способностей и лич-

ностных, равно как и протекающие при этом психические процессы,

у разных испытуемых могут существенно отличаться друг от друга.

Один и тот же тест у разных людей может измерять различные функции,

а это значит, что проверкой содержания теста никак нельзя определить (

измеряемые им психические функции. Так, выпускники колледжа могут

решить некоторую задачу вербальными или математическими средства-

ми, тогда как механик придет к тому же решению путем пространствен-

ной визуализации. Тест на решение задач для школьников у студентов

выявит лишь индивидуальные различия в скорости вычислений. Кон-

кретным примером нежелательных последствий ориентации на анализ

содержания тестов способностей может послужить исследование, прове-

денное с помощью теста на подстановку цифра-символ (Т.Е. Burik,

1950). Было установлено, что среди старшеклассников этот тест, считав-

шийся типичным тестом усвоения кода, измеряет преимущественно мо-

торную скорость.

Очевидная валидность. Валидность по содержанию не следует

смешивать с очевидной валидностью. Последняя, собственно, и не

является валидностью как таковой. Она относится не к тому, что тест на

самом деле измеряет, а к тому, что он при первом рассмотрении якобы

измеряет. Очевидная валидность-это то, насколько тест кажется ценным

испытуемому, официальным липам ппичт>-"- - ---

131 ВАЛИДНОСТЬ. ОСНОВНЫЕ ПОНЯТИЯ

пользовании, или другим неспециалистам. По сути своей очевидная ва-

лидность отражает отношение последних к тесту. Хотя обычное употре-

бление термина <валидность> в данной связи может вводить

в заблуждение, сама по себе очевидная валидность-желательное свой-

ство теста. Например, когда тесты, первоначально предназначенные для

детей и рассчитанные на условия школы, были впервые применены

к взрослым, те часто относились к таким тестам враждебно и критично

именно из-за отсутствия очевидной валидности. В самом деле, если со-

держание теста представляется странным, неуместным, глупым или дет-

ским, результатом будет ухудшение обстановки тестирования, несмотря

на действительную валидность теста.


Очевидная валидность особенно желательна при тестировании

взрослых. Ее часто удается повысить простой переформулировкой зада-

ний так, чтобы они казались естественными тестируемому контингенту.

Например, если тест, состоящий из простых арифметических задач, пред-

назначен для рабочих механического цеха, то в условиях должны фигу-

рировать машины или станки, а не апельсины, которые можно купить на

36 центов, или иные предметы и персонажи из школьного задачника.

Точно так же арифметический текст для военно-морского персонала луч-

ше формулировать в морских терминах. Разумеется, очевидную валид-

ность ни в коем случае нельзя трактовать как эквивалент объективно

установленной валидности. Нельзя рассчитывать на то, что улучшение

очевидной валидности теста сразу поднимет его объективную валид-

ность. Вместе с тем неправильно думать, что переделка теста, повышаю-

щая его очевидную валидность, никак не сказывается на его объективной

валидности. Поэтому валидность теста в его окончательной формевсег-

да необходимо проверить заново.

ВАЛИДНОСТЬ ПО КРИТЕРИЮ

Валидность по критерию показывает, насколько по результатам теста

можно судить об интересующем нас аспекте поведения индивида в на-

стоящем или будущем. Чтобы определить ее, выполнение теста соотно-

сят с критерием, т.е. непосредственной и независимой мерой того, что

должен предсказать тест. Так, для теста технических способностей крите-

рием может быть последующая работа на производстве; для теста го-

товности к обучению это могут быть оценки, получаемые в колледже;

для теста на невротизм-отзывы коллег испытуемого или другие до-

ступные сведения о его поведении при разных жизненных обстоятель-

ствах.

Текущая и прогностическая валидности. Критериальную ме-

ру, по которой устанавливается валидность тестовых показателей, мож-

но получить почти одновременно с ними или же через установленный

промежуток времени. В зависимости от временной связи между крите-

рием и тестом <Нормы Американской психологической ассоциации>

(Standards.., 1974) различают текущую и прогностическую валидности.

Термин <предсказание> может использоваться как в широком смысле,

означая прогноз на основе данных тестирования поведения испытуемого

в реальной (критериальной) ситуации, так и в более узком смысле,

указывая лишь на временной интервал. В последнем смысле он и ис-


пользуется в выражении <прогностическая валидность>. Информация, со-

132 пгинципы [кихоютчпкого ll(тиloвлния

используемых при отборе и распределении персонала. Прием на работу.

отбор учащихся в колледжи или профессиональные училища, военнослу-

жащих на курсы специальной НОДГОТОРКИ-ВОТ примеры ситуаций, когда

нужно знать валидность используемых гесгов. Сюда же можно отнести

использование тестов при выявлении лиц, склонных в стрессовых ситуа-

циях к эмоциональным расстройства.м" и назначение курса лечения, наи-

более подходящего тому или иному больному с расстройством психики.

В ряде случаев текуща.я вялидность заменяет валидность прогности-

ческую. Часто практически невыгодно слишком затягивать валидацию,

без которой невозможно установить прогностическую валидность или

сформировать предвари гельн\ к) выборку, соответствующую целям те-

стирования. Поэтому в качесч ве гомпромиссного решения тесты прово-

дятся на труппах.. для которых уже .имеются критерИйЛьиые данные. На-

пример, результаты тестирования студентов сравниваются с их успевае-

мостью, результаты тестирования служащих-с их успехами на про-

изводстве.

Вместе с тем в ог-рсделениых ситуациях текущая валидность гораздо

точнее отвечает существу решаемых задач. Различие между двумя вида-

ми валидности. рассматриваемыми в данном разделе, основано не на

времени, а на целях тестирования. Текущая валидность используется

в тестах, оценивающих настоящее положение дел, а не предсказывающих

будущие результаты, ь.сли мы "нрашиваем, невротик ли Смит, то это оз-

начает, что нас интересует текущая валидность. Если же мы хотим знадь,

склонен ли Смит к неврозам, то это значит, что нас интересует прогно-

стическая валидность.

Поскольку критепий екущей валидности всегда применяется в мо-

мент проведения теста, о"-г<лительно спросить, ка.кова же в подобных

случаях роль теста 1 ..явное соображение то, что тест является более

простым, быстрым и дешевым заменителем процедуры получения крите-

риальных данных. Например, если сбор критериальных данных требует

постоянного наблюдения больного в стационаре в течение двух недель,

то тест, позволяющий отдели гь норму от патологии и сомнительных

случаев, заметно уменьшает число людей, запятых диагностическим

наблюдением.

Контаминация критерия. При определении валидности теста не-