ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.10.2020
Просмотров: 8422
Скачиваний: 53
96
товых баллов основывается скорее на принципах операционального
удобства, чем на теоретической необходимости. Психометрически кор-
ректные процедуры получения устойчивых тестовых норм возможны с
помощью специальных методов непараметрической статистики (крите-
рий «хи-квадрат» и т. п.) для распределений произвольной формы.
Выбор статистической модели распределения - законный произвол
психометриста, пока сам тест выступает в качестве единственного эта-
лона измеряемого свойства. В этом случае остается лишь тщательно
следить за соответствием сферы применения диагностических норм
той выборке испытуемых, на которой они были получены. Произволь-
ность в выборе статистической модели шкалы исчезает, когда речь за-
ходит о внешних по отношению к тесту критериях.
Репрезентативность критериальных тестов. В таких тестах в ка-
честве реального эталона применяется критерий, ради которого со-
здается тест, - целевой критерий. Особое значение такой подход име-
ет в тех областях практики, где высокие результаты могут дать узко-
специализированные диагностические методики, нацеленные на очень
конкретные и узкие критерии. Такая ситуация имеет место в обуче-
нии: тестирование, направленное на получение информации об уров-
не усвоения определенных знаний, умений и навыков (При профес-
сиональном обучений), должно точно отражать уровень освоения этих
навыков и тем самым давать надежный прогноз эффективности кон-
кретной профессиональной деятельности, требующей применения этих
навыков. Так возникают «тесты достижений», по отношению к кото-
рым критериальный подход обнаружил свою высокую эффективность
(Гуревич К. М, Лубовский В. И,, 1982).
Рассмотрим операциональную схему шкалирования, применяе-
мую при создании критериального теста. Пусть имеется некоторый
критерий С, ради прогнозирования которого психодиагност создает
тест X. Для простоты представим С как дихотомическую переменную с
двумя значениями: 1 и 0. С, = 1 означает, что
j
-й субъект достиг кри-
терия (попал в «высокую» группу по критерию), С
j
=0 означает, что
i
-й
субъект не достиг критерия (попал в «низкую» группу). Психодиагност
применяет на нормативной выборке тест X, и в результате каждый ин-
дивид получает тестовый балл X
i
. После того как для каждого индиви-
да из выборки становится известным значение С (иногда на это тре-
97
буются месяцы и годы после момента тестирования), психодиагност
группирует индивидов по порядку возрастания балла X
i
и для каждого
деления исходной шкалы сырых тестовых баллов подсчитывает эмпи-
рическую вероятность Р попадания в «высокую» группу по критерию
С. На рис. 5 показаны распределения вероятности Р (C
i
= 1) в зависи-
мости от X
i
Рис. 5 Эмпирическая зависимость между вероятностью
критериального события и тестовым баллом
Очевидно, что кривая на рис. 5 по своей конфигурации может
совершенно не совпадать с кумулятивной кривой распределения час-
тот появления различных X
i
. Кривая, представленная на рис. 5, явля-
ется эмпирической линией регрессии С по X
i
Теперь можно сформули-
ровать основное требование к критериальному тесту: линия регрессии
должна быть монотонной функцией С от X
i
Иными словами, ни для од-
ного более высокого значения X. вероятность Р не должна быть мень-
шей, чем для какого-либо менее высокого значения X
i
Если это усло-
вие выполняется, то открывается возможность для критериального
шкалирования сырых баллов X. Так же как в случае с интервальной
нормализацией», когда применяется поточечный перевод интервалов
Х в интервалы Z, для которых выполняется нормальная модель рас-
пределения, так и при критериальном шкалировании к делениям сы-
рой шкалы X применяется поточечный перевод прямо в шкалу Р на ос-
новании эмпирической линии регрессии. Например, если испытуемый
А получил по тесту X 18 сырых баллов и этому результату соответст-
вует Р=0,6, то испытуемому А ставится в соответствие показатель 60
%.
Конечно, любая эмпирическая кривая является лишь прибли-
женной моделью той зависимости, которая могла бы быть воспроизве-
98
дена на генеральной совокупности. Обычно предполагается, что на ге-
неральной совокупности линия регрессии С по Х должна иметь более
сглаженную форму. Поэтому обычно предпринимаются попытки ап-
проксимировать эмпирическую линию регрессии какой-либо функ-
циональной зависимостью, что позволяет затем производить прогноз с
применением формулы (а не таблицы или графика).
Например, если линия регрессии имеет вид приблизительно та-
кой, какой изображен на рис. 6, то применение процентильной нор-
мализации позволяет получить простую линейную регрессию С по
нормализованной шкале Z. Это как раз тот случай, когда имеет место
эквивалентность стратегии, использующей выборочно-статистические
тестовые нормы, и стратегии, использующей критериальные нормы.
Рис. 6. Зависимость вероятности критериального события
Р от
нормально распределенного диагностического параметра
X
Операции по анализу распределения тестовых баллов, построе-
нию тестовых норм и проверке их репрезентативности. Завершая этот
раздел, кратко перечислим действия, которые последовательно дол-
жен произвести психолог при построении тестовых норм.
1. Сформировать выборку стандартизации (случайную или стра-
тифицированную по какому-либо параметру) из той популяции, на ко-
торой предполагается применять тест. Провести на каждом ис-
пытуемом из выборки тест в сжатые сроки (чтобы устранить ирреле-
вантный разброс, вызванный внешними событиями, происшедшими за
время обследования).
2. Произвести группировку сырых баллов с учетом выбранного
99
интервала квантования (интервала равнозначности). Интервал опре-
деляется величиной W/m , где W=x
max
— х
max
; m - количество интер-
валов равнозначности (градаций шкалы).
3. Построить распределение частот тестовых баллов (для задан-
ных интервалов равнозначности) в виде таблицы и в виде соответ-
ствующих графиков гистограммы и кумуляты.
4. Произвести расчет среднего арифметического значения и
стандартного отклонения, а также асимметрии и эксцесса с помощью
компьютера. Проверить гипотезы о значимости асимметрии и эксцесса.
Сравнить результаты проверки с визуальным анализом кривых рас-
пределения.
5. Произвести проверку нормальности одного из распределений
с помощью критерия Колмогорова (при n < 200 с помощью более мощ-
ных критериев) или произвести процентильную нормализацию с пе-
реводом в стандартную шкалу, а также линейную стандартизацию и
сравнить их результаты (с точностью до целых значений стандартных
баллов).
6. Если совпадения не будет - нормальность отвергается; в этом
случае произвести проверку устойчивости распределения расщепле-
нием выборки на две случайные половины. При совпадении норма-
лизованных баллов для половины и для целой выборки можно считать
нормализованную шкалу устойчивой.
7. Проверить однородность распределения по отношению к
варьированию заданного популяционного признака (пол, профессия и
т. п.) с помощью критерия Колмогорова. Построить в совмещенных ко-
ординатах графики гистограммы и кумуляты для полной и частной вы-
борок. При значимых различиях разбить выборку на разнородные
подвыборки.
8. Построить таблицы процентильных и нормализованных тесто-
вых норм (для каждого интервала равнозначности сырого балла). При
наличии разнородных подвыборок для каждой из них должна быть
своя таблица.
9. Определить критические точки (верхнюю и нижнюю) для до-
верительных интервалов (на уровне Р < 0,01) с учетом стандартной
ошибки в определении среднего значения.
10. Обсудить конфигурацию полученных распределений с уче-
100
том предполагаемого механизма выполнения того или иного теста.
11. В случае негативного результата: отсутствия устойчивых
норм для шкалы с заданным числом градаций (с заданной точностью
прогноза критериальной деятельности) - осуществить обследование
более широкой выборки или отказаться от использования, данного
теста.
3.2. НАДЕЖНОСТЬ ТЕСТА
В дифференциальной психометрике проблемы валидности и на-
дежности тесно взаимосвязаны, тем не менее мы последуем традиции
раздельного изложения методов проверки этих важнейших пси-
хометрических свойств теста.
Надежность и точность. Как уже отмечалось в разделе 3.1, об-
щий разброс (дисперсию) результатов произведенных измерений мож-
но представить как результат действия двух источников разнообразия:
самого измеряемого свойства и нестабильности измерительной проце-
дуры, обусловливающей наличие ошибки измерения. Это пред-
ставление выражено в формуле, описывающей надежность теста и ви-
де отношения истинной дисперсии к дисперсии эмпирически заре-
гистрированных баллов:
2
2
x
T
S
S
a
=
(3.2.1)
Так как истинная дисперсия и дисперсия ошибки связаны оче-
видным соотношением, формула (3.2.1) легко преобразуется в фор-
мулу Рюлона:
2
2
1
x
e
S
S
a
-
=
(3.2.2)
где а - надежность теста;
2
e
S
. -дисперсия ошибки.
Величина ошибки измерения - обратный индикатор точности из-