ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.08.2024
Просмотров: 785
Скачиваний: 0
СОДЕРЖАНИЕ
Часть 1 -содержательной стороне современной тестологии (особый инте-
Глава 1. Функции и происхождение
Глава 2. Природа психологических тестов
Глава 3. Социальные и этические аспекты
Глава 4. Нормы и интерпретация
Глава 10. Тесты для специфических
Глава II. Групповое тестирование
Часть 1. Классификация. Отметьте картинку, не принадлежащую трем остальным,
Часть 1. Вербальные способности. Каждое задание начинается с пары связанных
Часть II. Математические способности. Каждое задание содержит две величи-
связан с изучением влияния на валидность теста интраиндивидуальной
вариативности результатов. Гипотеза, согласно которой тест лучший
предиктор для тех индивидов, чье выполнение разных частей теста более
последовательно, а значит их суммарные результаты более надежны, ча-
стично подтвердилась, но изучавшееся соотношение оказалось сложнее,
чем ожидалось (R.F. Berdie, 1969).
При клинических исследованиях было обнаружено, что личностные
опросники, заполняемые самим испытуемым, для одних типов невроза
более валидны, чем для Других (S. С. Fulkerson, 1959). Особенности пове-
дения при разных типах невроза таковы, что испытуемые одного типа
отвечают на опросники старательно и точно, тогда как другие-небреж-
но и уклончиво. Индивид, для которого характерна точность и тщатель-
ность подробностей, который озабочен своими проблемами и прибегает
к интеллекту как к средству защиты, по-видимому, более точно воспрои-
зведет в опроснике картину своих эмоциональных затруднений, чем им-
пульсивный и беспечный индивид, который стремится избежать не-
приятных мыслей и эмоций и для кого первой защитной реакцией
является отрицание.
Э. Гизелли (Е.Е. Ghiselli, 1956; 1960й; 1960; 1963, 1968; E.E. Ghiselli,
E. P. Sanders, 1967) много занимался проблемой модераторов в про-
изводственной ситуации. При обследовании водителей такси
(Е.Е. Ghiselli, 1956) корреляция между тестом способностей и крите-
риальным выполнением равнялась лишь 0,22. Затем группа, исследовав-
шаяся по данным теста профессиональных интересов, была разбита на
три подгруппы. Для водителей, чьи интересы больше всего соответство-
вали работе, валидность теста способностей оказалась равной 0,664.
Во многих своих исследованиях Э. Гизелли для каждого испытуемо-
165 ВАЛИДНОСТЬ. ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ
гнозируемыми критериальными показателями (чем меньше D, тем лучше
прогнозируемый критериальный показатель). Сравнивая результаты вы-
полнения каждого задания в группах с разными значениями D, он строил
шкалу прогнозируемости, применяя затем к новой выборке, в которой
выделялись подгруппы с лучшей и худшей прогнозируемостью, и для
обеих подгрупп сравнивались значения валидности исходного теста.
Этот метод оказался многообещающим при выявлении индивидов, для
которых тест мог быть хорошим или плохим предиктором. Он был так-
же использован при решении вопроса о том, какой из двух тестов
является лучшим предиктором для данного индивида (Е. Е. Ghiselli,
1960я).
Некоторые исследователи (M.D.Dunnette, 1972; R.Hobert,
M.D.Dunnette, 1967) считают, что показатель D, основанный на абсо-
лютной величине ошибки прогноза без учета ее направленности, может
затушевывать важные индивидуальные различия. Ввиду этого были
предложены процедуры раздельного анализа случаев заниженного и за-
вышенного прогноза.
В настоящее время выявление и использование модераторов все еще
находятся в стадии исследования. Необходима большая осторожность,
чтобы избежать методических ловушек (N.M.Abrahams, 1972а, Ь;
M.D. Dunnette, 1972; Е.Е. Ghiselli, 1972; W.F. Velicer, 1972a, b). Резуль-
таты обычно действительны только для условий, в которых они были
получены. Важно к тому же проверять, насколько модератор действи-
тельно улучшает прогноз, который можно было бы получить и другими,
более прямыми путями (С. С. Finder, 1973).
/
ОБЪЕДИНЕНИЕ ДАННЫХ РАЗЛИЧНЫХ ТЕСТОВ
Для предсказания критерия обычно требуется не один, а несколько те-
стов. Большинство критериев достаточно сложны, а критериальные
меры зависят от целого ряда различных качеств. Если такой критерий
измеряется посредством одного теста, то этот тест должен быть весьма
разнородным. Уже отмечалось (гл. 5), что относительно однородный
тест, измеряющий преимущественно одно качество, позволяет получать
более однозначные результаты. Поэтому обычно предпочтительней
пользоваться серией из нескольких относительно однородных тестов,
каждый из которых нацелен на какой-то один аспект критерия, чем од-
ним большим тестом, представляющим собой мешанину самых разно-
родных заданий.
/ Когда для прогноза применяется серия специально подобранных те-
стов, такая серия называется батареей. Главная проблема использования
батареи состоит в том, как учитывать результаты отдельных тестов при
выработке решения в каждом индивидуальном случае. В этой связи при-
меняются преимущественно два типа статистической обработки резуль-
татов, один из которых основан на использовании уравнения множе-
ственной регрессии, а другой-системы нормативных результатов
Когда тесты применяются для интенсивного индивидуального иссле-
дования, скажем для клинического диагноза, при консультировании или
при оценке руководителей высоких рангов, экспериментатор, как прави-
ло, не прибегает к статистическому анализу результатов. Заполняя меди-
166 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
опыта и теоретических соображений. Такое клиническое использование
тестовых результатов подробнее рассматривается в гл. 16.
Уравнение множественной регрессии. Уравнение множествен-
ной регрессии позволяет для каждого испытуемого по результатам всех
тестов батареи рассчитать значение прогнозируемого критерия. Следую-
щее уравнение регрессии иллюстрирует применение этой процедуры для
предсказания успеваемости старшеклассника по математике на основе
результатов вербального (V), числового {N) тестов, а также теста мышле-
ния {R).
Успехи в математике = 0,21 + 0,21 + 0,327? + 1,35
В этом уравнении станайн ученика по каждому из трех тестов умно-
жается на соответствующие веса. Сумма трех таких произведений плюс
константа 1,35 дает прогнозируемый станайн ученика по математике.
Предположим, Билл Джонс получил следующие станайны:
вербальный тест 6
Числовой тест 4
Тест на мышление 8
Ожидаемые успехи по математике у этого ученика будут равны:
0,21 х б + 0,21 х 4 + 0,32 х 8 + 1,35 == 6,01. Итак, ожидаемый станайн
Билла примерно 6. Вспомним (гл. 4), что станайн 5 отвечает среднему
уровню. Значит, Билл, вероятно, будет иметь по математике оценки не-
сколько выше среднего. Его очень хорошее выполнение теста на мышле-
ние (R = 8) и неплохие результаты по вербальному тесту (V = 6) ком-
пенсируют невысокую скорость и точность вычислений (N = 4).
Конкретные процедуры вычислений, связанных с применением урав-
нений регрессии, читатель найдет в учебниках по статистике для психо-
логов (G. P. Guilford, В. Fruchter, 1973). Существенно, что такие уравне-
ния основываются на корреляции каждого теста с критерием и тестов
между собой. .Очевидно, что тесты, сильнее коррелирующие с критерием,
должны иметь больший вес. Столь же важно, однако, учитывать корре-
ляцию каждого теста с другими тестами батареи. .Высокая корреляция
указывает на ненужное дублирование одного теста другим, ибо это озна-
чает, что тесты в значительной мере направлены на один и тот же аспект
критерия. Включение таких тестов не повышает существенно валидности
всей батареи, даже если они тесно коррелированы с критерием. В этом
случае применение одного из этих тестов столь же эффективно, что
и обоих, поэтому в батарее следует оставить только один тест.
Однако даже после того, как случаев наиболее выраженного дубли-
рования в батарее не остается, тесты все равно будут в той или иной
степени коррелировать друг с другом. Ясно, что чем более <уни-
кальным> является вклад теста в общие результаты батареи, тем боль-
шим должен быть его вес. Таким образом, при расчете параметров урав-
нения регрессии вес каждого теста прямо пропорционален его корреля-
ции с критерием и обратно пропорционален корреляции с другими
тестами. Это значит, что максимальный вес получает тест, обладающий
наибольшей валидностью и в наименьшей степени дублирующий осталь-
ную часть батареи.
Валидность целой батареи можно найти, вычисляя множественную
корреляцию (R) между входящими в нее тестами и критерием. Эта кор-
реляция отвечает максимуму прогностической силы батаоеи. котопнй
167 ВАЛИДНОСТЬ. ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ
Следует иметь в виду, что эти веса оптимальны только для частной
выборки, в которой они были найдены. Поскольку в используемых при
определении весов коэффициентах корреляции возможны случайные
ошибки, то эти веса могут меняться от выборки к выборке. Поэтому ба-
тарею следует подвергнуть перекрестной валидации, коррелируя ее
с прогнозируемыми и действительными критериальными показателями
для новой выборки. Существуют формулы для оценки ожидаемого сни-
жения множественной корреляции при применении уравнения регрессии
к другой выборке, но, если есть возможность, желательно провести эм-
пирическую проверку. В целом же, чем больше выборка, по которой
определяются веса, тем меньше упомянутое снижение корреляции.
В известных условиях прогностическую валидность батареи удается
повысить, включая в уравнение регрессии тест, имеющий нулевую корре-
ляцию с критерием и высокую корреляцию с одним из тестов батареи.
Такая любопытная ситуация возникает, когда тест, не коррелирующий
с критерием, действует как подавляющая переменная и элиминирует или
подавляет безотносительные к критерию переменные другого теста. На-
пример, понимание читаемого текста может тесно коррелировать с пока-
зателями теста математических или технических способностей, поскольку
выполнение заданий этих тестов требует понимания сложной письмен-
ной инструкции. Если понимание текста не имеет отношения к прогнози-
руемой деятельности, оно вносит дополнительную дисперсию ошибки
в результаты и снижает прогностическую валидность теста. Добавив
к батарее тест на понимание читаемого и включив его результаты
в уравнение регрессии, мы устраним эту дисперсию ошибки и повысим
валидность батареи. Веса таких добавочных тестов входят в уравнение
регрессии с отрицательным знаком. Поэтому чем выше результат испы-
туемого по тесту понимания читаемого текста, тем большая величина
вычитается из его результата по тесту математических или технических
способностей.
Использование такого рода подавляющих переменных поясняет сле-
дующее исследование 63 механиков промышленных предприятий
(W.W. Sorenson, 1966). Наиболее эффективная прогностическая батарея
включала (1) анкету (сведения об образовании, опыте работы и т.п.) об-
щего характера (корреляция с критерием 0,30), (2) тест на механическую
сметку типа <завинчивание болтов и гаек> (корреляция с критерием 0,22)
и (3) тест на понимание техники, ориентированный на общее знание
принципов механики (корреляция с критерием - 0,04; корреляция с те-
стом (2) == 0,71). Третий тест выступал в роли подавляющей переменной,
что видно из следующего уравнения регрессии:
С = 177\ + ЮТ - 6Тз + 866. >
В отсутствие такой переменной батарея давала бы завышенный прогноз
для тех, кто справлялся с тестом 2 благодаря своим теоретическим зна-
чениям, а не практическим навыкам, требующимся для выполнения ра-
боты. Постороннее влияние <теоретического> компонента на результаты
теста 2 было тем самым подавлено.
Попытки использовать подавляющие переменные для повышения
валидноеT личностных тестов не дали ожидаемого эффекта
(J. S. Wiggins, 1973). Более того, в большинстве случаев предпочтительней
""""""е.пственный пересмотр теста, уменьшающий безотносительную
--- ""T такая корреляция неосуществима,
168
ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
Таблица 16
Данные, используемые для установления норма-
тивных результатов батареи GATB (United States
Department of Labor, 1958, p. 10)
стоит рассмотреть целесообразность введения <подавляющих> пере-
менных.
Система нормативных результатов. Другой подход к резуль-
татам батареи тестов состоит в использовании системы нормативных ре-
зультатов, т.е. системы минимальных проходных результатов, устанав-
ливаемых для каждого из тестов батареи. Тот, кто не достигает такого
минимума хотя бы по одному из тестов, считается не прошедшим тести-
рования. Положительное решение принимается только для тех, кто до-