ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.08.2024
Просмотров: 788
Скачиваний: 0
СОДЕРЖАНИЕ
Часть 1 -содержательной стороне современной тестологии (особый инте-
Глава 1. Функции и происхождение
Глава 2. Природа психологических тестов
Глава 3. Социальные и этические аспекты
Глава 4. Нормы и интерпретация
Глава 10. Тесты для специфических
Глава II. Групповое тестирование
Часть 1. Классификация. Отметьте картинку, не принадлежащую трем остальным,
Часть 1. Вербальные способности. Каждое задание начинается с пары связанных
Часть II. Математические способности. Каждое задание содержит две величи-
ке. Далее с помощью корреляционного анализа из всей батареи TALENT
выделяется набор тестов, наиболее близкий к калибруемому тесту. Нако-
нец, эквипроцентильным методом составляется таблица, устанавливаю-
щая соответствие между показателями выделенного набора из батареи
TALENTn данным тестом.
Были также получены данные, необходимые для выделения из бата-
реи TALENT набора, соответствующего каждому из тестов таких бата-
рей, как дифференцированные тесты способностей, классификационные
тесты профессиональной пригодности Дж. Фланагана и тесты общей
профессиональной пригодности Службы занятости США.
Особый интерес представляет исследование эталонных тестов, про-
веденное Службой тестирования в образовании при содействии Амери-
канского управления образования (R.M. Jaeger, 1973). Столь обстоятель-
ное исследование было предпринято для разработки сопоставимых
и действительно репрезентативных общенациональных норм по 7 наибо-
лее употребительным тестам навыков чтения, предназначенным для уче-
ников средних классов. В соответствии с необычайно тщательно разра-
ботанным экспериментальным замыслом в 50 штатах было обследовано
свыше 300 000 учеников IV-VI классов. Эталонный тест состоял из субте-
стов понимания текста и словарного запаса, входящих в национальный
тест школьных достижений, и для них в ходе исследования были уста-
новлены новые нормы. При установлении эквивалентности норм каждо-
му ребенку предъявлялись субтесты понимания текста и словарного за-
В. X. Ангоффом (W.H. Angoff, 1964, 1966, 1971 а) блестяще проанализированы техни-
ческие трудности, возникающие в связи с попытками добиться сопоставимости показате-
88 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
паса двух из семи батарей, каждая из которых составляла пару с любой
другой батареей. К некоторым группам применялись параллельные
формы двух субтестов из одной и той же батареи. В еще одних группах
предъявление пар тестов дублировалось в обратной последовательности,
что позволяло контролировать влияние порядка предъявления тестов.
Статистический анализ полученных данных эквипроцентильным мето-
дом позволил составить таблицы эквивалентности показателей для семи
тестов, было также составлено руководство по интерпретации результа-
тов тестов для их использования в школах заинтересованными лицами
(P.O. Loret, A. Seder, J.C. Bianchini, С. A. Vale, 1974).
Специфические нормы. Еще одним решением-и для большин-
ства тестов, вероятно, более реалистичным-проблемы неэквивалентно-
сти существующих норм является стандартизация тестов для более уз-
кой популяции, выбираемой сообразно специфическим целям каждого
теста. В таких случаях границы нормативной популяции должны быть
четко определены и приведены вместе с нормами. Так, можно указать,
что данные нормы относятся к управленческому персоналу крупных
фирм или к первокурсникам технических колледжей. Для многих целей
тестирования желательно иметь достаточно специализированные нормы.
Даже когда имеются репрезентативные нормы для широкой популяции,
часто оказываются полезными так называемые подгрутовые нормы. По-
требность в них возникает, когда показатели теста заметно меняются от
одной подгруппы к другой. Сами подгруппы могут формироваться по
признаку возраста, года обучения, типа школьной программы, пола, гео-
графического региона, проживания в городе или в сельской местности,
социоэкономического уровня и т.д. Характер использования теста опре-
деляет наиболее существенный признак, а также и предпочтительность
общих или специфических норм.
Следует также упомянуть о локальных нормах, которые нередко раз-
рабатываются пользователями тестов для конкретных социальных еди-
ниц (social setting). Группы, к которым относятся такие нормы, еще более
специфичны, чем даже обсуждавшиеся выше подгруппы. Так, наниматель
может выработать нормы, лучше отвечающие специфике предлагаемой
им работы; администрация колледжей-нормы, рассчитанные на обуче-
ние в данном колледже; а школа может оценивать выполнение тестов
своими учениками в соответствии с собственным распределением показа-
телей. Локальные нормы такого типа в большей степени, чем нацио-
нальные, отвечают таким задачам тестирования, как предсказание дости-
жений в труде или учебе, сравнение относительного уровня знаний детей
по различным предметам, исследование динамики их развития.
Фиксированная референтная группа. Хотя большинство
производных показателей ориентировано на непосредственную норма-
тивную интерпретацию выполнения теста, существуют и примеча-
тельные исключения. Одно из них состоит в использовании фиксирован-
ной референтной группы для обеспечения сопоставимости и преемствен-
ности показателей без обращения к нормативным оценкам выполнения
теста. В этом случае для нормативной интерпретации данных необходи-
мо сопоставить их с нормами, полученными для сходной популяции. Не-
редко для этой цели используются локальные или иные специфические
нормы.
Одним из наиболее очевидных примеров шкал, выработанных на
/пгТТТЛГТЭМиЙ тчгттгг ппгггтмгм r,>nrn -
89 НОРМЫ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ ТЕСТА
способности к обучению (SAT) Совета колледжей (W.H.Angoff, 1962;
1971b). Между 1926 (когда SAT был применен впервые) и 1941 г. показа-
тели этого теста выражались в нормативной шкале, для которой среднее
значение и стандартное отклонение определялись по показателям абиту-
риентов, полученным при очередном применении теста. В связи с увели-
чением и качественным изменением числа колледжей, подчиненных Сове-
ту, изменилась и популяция абитуриентов, но было решено сохранить
преемственность шкалы SAT, ибо в противном случае индивидуальные
показатели зависели бы от особенностей контингента, проходящего об-
следование в том или ином году. Еще более серьезной причиной сохра-
нения преемственности шкалы было различное действие селективных
факторов на одних и тех же учащихся, в результате чего они выполняли
SAT лучше или хуже в зависимости от периода года. Поэтому после
1941 г. все показатели SA Г выражаются в шкале, построенной согласно
среднему значению и стандартному отклонению данных примерно 11000
абитуриентов, проходивших этот тест в 1941 г. Таким образом, эти аби-
туриенты составили фиксированную референтную группу, относительно
которой производится шкалирование всех последующих форм данного
теста. Например, результат 500 любой формы SAT соответствует средне-
му показателю для выборки 1941 г., показатель 600 приходится на 1ст
выше среднего значения и т.д.
Чтобы можно было переводить первичные показатели любой
формы SAT та показатели этой фиксированной референтной группы,
в каждую такую форму включается небольшой эталонный тест. С по-
мощью этого теста каждая новая форма соотносится с одной или двумя
более ранними формами, те, в свою очередь,-с другими, еще более ран-
ними, и т.д., по цепочке, с формой 1941 г. Такие ненормативные показа-
тели SAT затем можно интерпретировать, сопоставляя их с нужным рас-
пределением показателей конкретного колледжа, типа колледжей, регио-
на и т.д. Подобные специфические нормы более пригодны для принятия
решений о приеме, чем ежегодные нормы; основанные на данных всей
популяции абитуриентов. Более того, любые временные изменения попу-
ляции абитуриентов может обнаружить только шкала фиксированных
показателей.
В отличие от ранее обсуждавшихся шкал, основанных на примене-
нии национальных эталонных тестов, шкалы фиксированной референт-
ной группы не требуют формирования единой достаточно репрезента-
II тивной и адекватной вводимым нормам группы. Помимо практических
1 трудностей, связанных с подбором такой группы, и необходимости об-
1 новления норм оказывается, что многие задачи тестирования столь уни-
Н версальных норм и не требуют. Шкалы, основанные на данных фиксиро-
1 ванной референтной группы, в определенном отношении аналогичны
1 шкалам, применяемым в физическом измерении. В этой связи В. X. Ан-
1 гофф (W.H. Angoff, 1962, р. 32-33) пишет:
X-
<Вряд ли кто теперь точно знает первоначальное определение длины фута, которым
1 пользуются для измерения высоты и расстояния. Вряд ли кто назовет имя короля, чья
ступня была принята в качестве эталона. Вместе с тем мало таких, кто не смог бы оце-
нить длину или расстояние с помощью этой единицы измерения. Наше незнание букваль-
ного значения или происхождения фута ни в коей мере не делает его бесполезным, ведь,
сколько бы ни прошло времени, фут останется одним и тем же, и это позволяет нам ос-
воиться с ним. То же самое можно сказать и про другие единицы измерения-дюйм, ми-
90 ПРИНЦИПЫ rU:ИXOЛOrиЧF.CKOrO ТЕСТИРОВАНИЯ
должно следовать. Единственное следствие такого определения-установление постоян-
ства шкалы, что достигается в случае применения различных форм одного теста их стро-
гим взаимным уравниванием, а также получением дополнительных нормативных данных,
облегчающих интерпретацию и принятие конкретных решений, данных, подлежащих пере-
смотру, когда этого требуют обстоятельства>.
ИСПОЛЬЗОВАНИЕ ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ
ПРИ ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ ТЕСТА
Компьютеры заметно изменили почти все этапы тестирования-от со-
здания теста до его применения, подсчета первичных показателей реги-
страции и интерпретации. Выигрыш, который дает использование
компьютеров, даже самых первых, связан с буквально небывалым увели-
чением скорости, с какой осуществляется анализ данных, подсчет показа-
телей. Однако гораздо важнее для психологического тестирования разра-
ботка новых процедур и изыскание новых методов, которые были бы
неосуществимы, не окажись такого гибкого и скоростного способа пере-
работки данных, как использование компьютеров.
Различные нововведения, явившиеся результатом применения элек-
тронных машин, рассматриваются в соответствующих разделах настоя-
щей книги. В этом разделе обсуждается применение вычислительной тех-
ники при интерпретации показателей тестов. На элементарном уровне
большинство современных тестов, особенно тех, что предназначены для
группового применения, теперь приспособлены к машинной обработке
тестовых показателей (F. В. Baker, 1971). Некоторые издатели тестов,
а также ряд организаций по обработке тестовых данных принимают за-
казы на машинную обработку результатов тестирования. Хотя при этом
обычно используются особые бланки ответов, в вычислительных центрах
имеется аппаратура оптического сканирования, позволяющая считывать
ответы непосредственно с тестовых тетрадей. Такие новшества, как диаг-
ностическая обработка данных и динамический анализ (фиксация дости-
жений учащихся на различных этапах обучения), еще только входят
в употребление.
Несколько более высокий уровень использования компьютеров свя-
зан с приспособлением тестов к машинной интерпретации их показате-
лей, которая теперь обеспечивается для ряда тестов. В подобных случаях
определенные серии ответов связываются машинной программой с теми
или иными словесными формулировками, хранящимися в памяти ма-
шины. Этот подход применяется как в личностных тестах, так и в тестах
способностей. Например, проводя обследование с помощью многоста-
дийного личностного опросника, разработанного в штате Миннесота,
ММР1 (см. гл. 17), применяющий тест наряду с числовыми данными мо-
жет получить распечатку диагностических и интерпретационных форму-
лировок о тенденциях личности испытуемого и его эмоциональном со-
стоянии. Таким же образом тест различных способностей (см. гл. 13)
снабжается сообщением о возможностях профессионального роста, со-
стоящим из профиля результатов по отдельным субтестам и словесного
заключения. Последнее основано не только на данных теста, но и на ин-
формации об интересах и намерениях учащихся, полученной из заполнен-
ной ими анкеты будущей профессии. Применяемые в заключении форму-
лировки похожи на то, что мог бы в индивидуальной беседе сказать