ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.10.2020
Просмотров: 8411
Скачиваний: 53
76
встречаемости тех или иных элементов-единиц содержания постепен-
но эволюционировала к более сложным статистическим средствам. В
частности, еще в 1942 г. А. Болдуином был предложен подсчет совме-
стной встречаемости слов в тексте (Baldwin А., 1942). В конце 50-х го-
дов Ч. Осгуд с сотрудниками обогатил контент-анализ методикой «свя-
занности символов», в которой развивается принцип Болдуина, что
позволяет обнаруживать неслучайные, связанные между собой эле-
менты содержания, представленные в специальных матрицах (Семенов
В. Е., 1983; Osgood Ch., 1959). В сущности, эта методика была нача-
лом введения в контент-анализ корреляционной техники, а затем и
факторного анализа.
Новым этапом в развитии контент-анализа стала его компьюте-
ризация в 60-х годах. Ё Массачусетском технологическом институте
появился «универсальный анализатор» (The General Inquirer) - комп-
лекс компьютерных программ анализа текстовых материалов, при по-
мощи которого можно подсчитывать частоты категорий содержания
текста, получать различные индексы на основе совместного появления
этих категорий и т. д. (Stone Ph., Dunphy D., 1966). Подобным образом
были исследованы речи двадцати американских президентов при их
вступлении на этот пост, редакционные статьи в газетах разных стран,
личные письма, сочинения, вербальное поведение психически боль-
ных людей и прочие материалы. С 70-х годов в США разрабатываются
стандартные компьютерные программы анализа разнообразных доку-
ментов, которые предлагаются организациям и частным лицам (Сохоп
А., 1977), компьютерный контент-анализ развивается и в других стра-
нах (Deichelsel A., 1975).
Естественно, что использование компьютерных программ в кон-
тент-анализе обеспечивает этому методу явные преимущества, зак-
лючающиеся в надежности получаемых данных и быстроте анализа, по
сравнению с ручным, выполняемым людьми-кодировщиками, которые
подвержены ошибкам из-за утомления и субъективных факторов. Та-
ким образом, трудоемкость составления программ окупается тем ог-
ромным объемом содержания, которое достаточно быстро и надежно
можно проанализировать на компьютере, а также освобождением ко-
дировщиков от их чрезвычайно утомительного труда. В целом пробле-
мы использования машинного контент-анализа близки общей страте-
77
гии применения компьютеров в эмпирических социальных исследова-
ниях. Важно правильно определить, когда следует воспользоваться
машинным, а когда ручным анализом, что зависит от задач исследова-
ния, от объема материалов, подлежащих анализу, от степени их фор-
мализуемости.
ГЛАВА 3 ПСИХОМЕТРИЧЕСКИЕ ПСИХОДИАГНОСТИКИ
3.1. РЕПРЕЗЕНТАТИВНОСТЬ ТЕСТОВЫХ НОРМ
Основные статистические принципы построения тестов достаточ-
но полно освещены в появившейся в начале 80-х годов на русском
языке литературе по дифференциальной психометрике (Аванесов В.
С., 1982; Анастази А., 1982; Гайда В. К., Захаров В. П., 1982). Тем не
менее в указанных руководствах центральная проблема психометрики
тестов - вопрос о тестовых нормах - еще не получила пос-
ледовательного освещения. Прежде всего это относится к руководству
известной представительницы американской тестологии А. Анастази.
В руководстве Анастази не получают достаточного критического
обсуждения две основополагающие предпосылки традиционной за-
падной тестологии: вопрос о применении статистических норм (кван-
тилей распределения баллов) в качестве диагностических норм и воп-
рос о сведении всех эмпирических распределений к нормальной мо-
дели. Ниже эти предпосылки будут проанализированы в контексте
краткой реконструкции системы основных понятий дифференциальной
психометрики.
Статистическая природа тестовых шкал. Типичный измери-
тельный тест в психодиагностике - это последовательность кратких
заданий, или пунктов, дающая в результате ее выполнения испытуе-
мым последовательность исходов, которая затем подвергается одно-
значной количественной интерпретации. Примеры интерпретации в
интеллектуальных тестах, состоящих из отдельных задач: «правиль-
ное решение», «ошибочное решение», «отсутствие ответа» (пропуск
задачи из-за нехватки времени). Примеры интерпретации в случае
личностных опросников, состоящих из высказываний, предлагаемых
для подтверждения испытуемым: «подтверждение» (ответ «верно»),
78
«отвержение» (ответы «не согласен», «неверно»).
Суммарный балл по тесту подсчитывается с помощью ключа:
ключ устанавливает числовое значение исхода по каждому пункту.
Например, за правильное решение задания дается «+1», за непра-
вильное решение или пропуск - «О». Тогда балл буквально выражает
количество правильных ответов.
Исход по отдельному заданию подвержен воздействию не только
со стороны измеряемого фактора - способности или черты личности
испытуемого, но и побочных шумовых факторов, которые являются
иррелевантными по отношению к задаче измерения. Примеры слу-
чайных факторов: колебания внимания, вызванные неожиданными от-
влекающими событиями (шум на улице, стук в дверь и т. п.), трудно-
сти в понимании смысла задания (вопроса), вызванные особенностями
опыта данного конкретного испытуемого, и т. п. Последовательность
исходов оказывается последовательностью событий, содержащей по-
стоянный и случайный компоненты. Как известно, основным приемом,
позволяющим устранить искажающее влияние случайных факторов на
результат (суммарный балл), Является балансировка этого влияния с
помощью повторения. При этом фактически предполагается, что по-
вторение обеспечивает рандомизацию (случайное варьирование) не-
контролируемого фактора, в результате чего при суммировании исхо-
дов Положительные и негативные эффекты случайных факторов взаи-
мопоглощаются (о механизме рандомизации см.: Готтсданкер Р.,
1982).
В оптимальном тесте набор и последовательность заданий орга-
низуются таким образом, чтобы повысить долю постоянного компо-
нента и сократить долю случайного в величине суммарного балла. Тем
не менее, несмотря на различные статистические ухищрения, суммар-
ный балл в психологических измерениях содержит несравненно боль-
шую долю случайного компонента, чем в обычных физических изме-
рениях. В силу этого суммарный балл оказывается определенным
лишь в известных пределах, заданных ошибкой измерения.
Для того чтобы оценить эффективность, дифференциальную
ценность всей процедуры измерения, необходимо соотнести размеры
ошибки измерения с размерами разброса суммарных баллов, вызван-
ных индивидуальными различиями в измеряемой характеристике меж-
79
ду испытуемыми. В терминах Статистики речь идет о сравнении так
называемой истинной дисперсии распределения суммарных баллов с
дисперсией ошибки. Именно этим обусловлен необходимый интерес
психометристов к распределению суммарных баллов. Поэтому анализ
распределения необходим не только при использовании статистиче-
ских норм, но и в случае абсолютных и критериальных норм.
Как известно, частотное распределение суммарных баллов име-
ет удобную графическую интерпретацию в виде кривых распределе-
ний: гистограммы и кумуляты (см., в частности, удачное популярное
введение в описание распределений в книге: Кимбл Г., 1982, с. 55-
70). В случае гистограммы по оси абсцисс откладываются «сырые оч-
ки» -первичные показатели суммарных баллов, возможных для данно-
го теста, по оси ординат - относительные частоты (или проценты)
встречаемости баллов в выборке стандартизации (Анастази А., 1982, с.
66). Как известно, для «колоколообразной» кривой нормального рас-
пределения дисперсия визуализируется как параметр, ответственный
за «распластанность» графика плотности вероятности (теоретического
аналога эмпирической кумуляты) вдоль оси X. Чтобы визуализировать
дисперсию ошибки измерения, нужно было бы многократно провести
тест с одним испытуемым и построить графическое распределение
частот его индивидуальных баллов (рис. 1).
Очевидно, что дифференцирующая способность теста сводится к
нулю, если кривые, иллюстрирующие «истинную» и «ошибочную»
дисперсии» совпадают. Как видим, анализ распределения тестовых
баллов необходим уже для анализа надежности теста (см. раздел 3.2).
Проблема меры в психометрике и свойства пунктов теста. В фи-
зических измерениях калибровка шкалы производится на основе кон-
троля за равномерным варьированием измеряемого свойства в эта-
лонных объектах. Носителем меры является эталон- физический объ-
ект, стабильно сохраняющий заданную величину измеряемого свойст-
ва. В дифференциальной психометрике такие физические эталоны от-
сутствуют: мы не располагаем индивидами, которые были бы постоян-
ными носителями заданной величины измеряемого свойства.
80
Рис. 1.Соотношение индивидуальной и общей вариации
тестовых баллов
Роль косвенных эталонов в психометрике выполняют сами тес-
ты: в том смысле, в каком трудность задач можно рассматривать как
величину, прямо пропорционально сопряженную со способностью (чем
труднее задача, тем выше должен быть уровень способности, требуе-
мый для ее решения). Аналогом понятия «трудность» для «ли-
вопросов»
1
опросника является «сила»: более «сильные» высказыва-
ния (в логическом смысле) вызывают подтверждение (согласие) у
меньшего числа испытуемых. Ни трудность, ни силу пунктов теста
нельзя выявить иначе, чем с помощью проведения теста. Операцио-
нальным определением трудности оказывается «процентильная мера»:
процент испытуемых, справившихся с заданием теста (или ответивших
«верно» на «ли-вопрос»). Чем меньше процент, тем выше трудность.
Кривая распределения тестовых баллов отражает свойства пунк-
тов, из которых составлен тест. Если кривая имеет правостороннюю
асимметрию, то в тесте преобладают трудные задания; если кривая
имеет левостороннюю асимметрию, значит, большинство пунктов в
тесте - легкие (слабые) (рис. 2).
Рис. 2.Асимметрии распределения тестовых баллов
1
«Ли-вопросы» - это вопросы, содержащие высказывания, с которыми испытуемый должен ли-
бо согласиться, либо не согласиться.