ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.10.2020
Просмотров: 8434
Скачиваний: 53
121
цедуры возникают при наличии группы испытуемых, тесно общаю-
щихся между собой; тех, которые могут одновременно побывать и ис-
пытуемыми по отношению к тесту, и оценщиками по отношению друг к
другу. В отечественной литературе эта процедура получила со-
кращенное обозначение ГОЛ - «групповая оценка личности» (Кузьмин
Н. В., Семенов В. С., 1977).
Для того чтобы групповая оценка личности была источником
действительно валидной информации, оценщики должны согласованно
оценивать испытуемых. Если в оценках разных оценщиков нет согла-
сованности, то это означает, что либо оцениваемое свойство не про-
явилось у объекта оценивания, либо оценщики по-разному проинтер-
претировали инструкцию. Для измерения согласованности должна
быть составлена таблица с оценками (табл. 6).
Таблица 6
Оценщики
Испытуе-
мые
О
1
О
2
…
О
k
å
И
1
x
11
x
12
…
x
1k
C
1
И
2
x
21
x
22
x
2k
C
2
…
И
n
x
n1
x
n2
x
nk
C
n
Методы анализа данных, содержащихся в такой таблице, фор-
мально совершенно эквивалентны тем методам, которые применяются
для обработки таблиц «испытуемые - пункты» (см. раздел 3.1), В ча-
стности, суммы по строкам дают суммарные баллы, полученные каж-
дым испытуемым у всех оценщиков. Таким образом, оценщики в дан-
ном случае оказываются формально в роли пунктов теста. Рассчиты-
вая попарные корреляции между различными столбцами этой таблицы,
можно получить коэффициенты согласованности для отдельных пар
оценщиков. Глобальной мерой согласованности оценщиков может слу-
жить коэффициент надежности а Кронбаха - см. формулу (3.2.8).
Если же групповая оценка не обнаруживает надежности, то она
не может использоваться в качестве критерия валидизации при про-
верке валидности теста.
122
Эмпирическое значение коэффициента валидности рассчитыва-
ется как линейная или ранговая корреляция между двумя рядами зна-
чений: тестовыми баллами и суммарными баллами экспертной оценки.
Это эмпирическое значение при наличии невысокого коэффициента
надежности критерия корректируют по формуле
c
a
cx
r
tx
r
=
(3.3.1)
где
cx
r
- эмпирическая корреляция с критерием;
а
с
— надежность критерия;
r
tx
- корреляция с «истинным» критерием («истинная» валид-
ность теста).
Анализ пунктов по критерию валидности. Валидность всего теста
целиком зависит от валидности входящих в него пунктов. Макси-
мальная валидность достигается за счет отбора таких пунктов из пи-
лотажной батареи, которые, обладая значимой корреляцией с крите-
рием, минимально коррелируют между собой. Отбор пунктов именно
по критерию валидности обеспечивает максимальную прагматическую
эффективность теста. Вручную (на калькуляторе) такой отбор можно
произвести, рассчитав
бисериальную
корреляцию (или
фи-
корреляцию) критерия с каждым пунктом из пилотажной батареи, - см.
формулы (3.2.15) и (3.2.17). Компьютер позволяет использовать более
эффективный алгоритм, основанный на анализе частных корреляций
между критерием и пунктами и предполагающий построение уравне-
ния множественной регрессии (Аванесов В. С., 1982, с. 153-157). В
результате в таком уравнении каждый пункт получает весовой коэф-
фициент
1
, количественно выражающий его вклад в критерий, не сво-
димый к вкладу других пунктов, т. е. поиск оптимального набора
пунктов автоматизируется. X. Гаррет приводит следующую яркую ил-
люстрацию эффективности алгоритма, позволяющего подобрать опти-
мальный набор пунктов. Пусть имеется 20 пунктов, каждый из которых
имеет корреляцию с критерием порядка 0,30. Оказывается, если эти
пункты в среднем коррелируют друг с другом на уровне
ij
r
= 0,60, то
1
Этот весовой коэффициент и используется как ключ к данному пункту в новой, скорректиро-
ванной версии теста.
123
множественная корреляция суммарного тестового показателя с крите-
рием равняется 0,38, если же г
а
= 0,30, множественная корреляция
повышается до 0,52. Наконец, при r
tj
= 0,10
эффективность (валидность) теста достигает весьма высокого
уровня: 0,79. Те же самые проблемы возникают при подборе опти-
мальной батареи тестов, направленных на прогнозирование какого-то
одного социально ценного показателя (успеваемость, производитель-
ность труда и т. п.).
Как уже указывалось в разделе 3.1, тест, обладающий высокой
критериальной валидностью должен давать монотонную зависимость
величины критерия от тестового балла (см. рис. 6). Для того чтобы по-
лучить монотонную линию регрессии, психодиагност должен включить
в тест X только такие пункты, которые являются валидными по крите-
рию С. В противном случае на кривой неминуемо появятся провалы
1
.
Крутизну линии регрессии можно существенно повысить за счет наце-
ленного отбора из первоначальной батареи только таких заданий, ко-
торые обладают значимо высокой корреляцией (или регрессионным
коэффициентом в уравнении множественной регрессии) с критерием.
После отбора валидных пунктов должна быть произведена пере-
крестная валидизация (см. Анастази А., 1982, с. 197). В чем ее смысл?
Если при анализе корреляций между батареей из 200 заданий и ка-
ким-то критерием получают 10 заданий, значимо коррелирующих е
критерием на уровне ошибки р < 0,05, то это может быть следствием
чисто случайного совпадения (сравните 10/200=0,05). Чтобы убедить-
ся в том, что отобранные пункты теста действительно могут различать
(или прогнозировать) критерий, нужно рассмотреть, как коррелируют
с критерием эти пункты на другой выборке, которая не использо-
валась при их отборе.
Простой метод реализации принципа перекрестной валидизации
состоит в том, что вся выборка делится на две случайные половины и
производится раздельный расчет корреляций пунктов с критерием
для-. каждой половины выборки. Если выделенные (значимые) пункты
совпадают, то перекрестную валидизацию можно считать удачной.
1
Некоторые незначительные локальные провалы при наличии общей высокой регрессии (высо-
кий контраст крайних Р от X) можно устранить, увеличивая интервал равнозначности.
124
Метод критериального тестирования очень трудоемок. .Прак-
тически невозможно построить критериальный тест за счет одной ста-
тистики, сколь бы мощными выборками и батареями заданий мы ни
располагали. Необходима работа над содержательной валидностью
заданий. Критериальное тестирование имеет ограниченное примене-
ние в задачах построения методик с широкой областью применения.
Следует еще раз подчеркнуть, что анализ валидности отдельных
пунктов служит не только прагматическим целям, но может и должен
служить целям углубления представлений о содержательно-
теоретическом смысле измеряемого свойства: на основании содержа-
тельного анализа пунктов, отобранных по критерию, психолог уточня-
ет и корректирует свою первоначальную теоретическую схему, свое
понимание измеряемого свойства.
Достоверность самоотчета. Рассматривая общую проблемы ва-
лидности целесообразно выделить вопрос об обеспечении валидности
процедур стандартизованного самоотчета. Сюда относятся различные
техники шкалирования, классифицирования, сравнения и тест-
опросники. Вербальная форма тестового материала порождает у испы-
туемого определенные встречные гипотезы о цели тестирования. Если
ситуация диктует испытуемому необходимость фальсификации отве-
тов, то он редко отказывается от этой возможности.
Валидность — характеристика любых измерений, в том числе и
физических. Специфические проблемы валидности, связанные с ак-
тивностью человека как объекта психодиагностики, целесообразно
обозначить особым образом - проблемы обеспечения достоверности.
Психологические факторы, от которых зависит достоверность
самоотчета, условно можно сгруппировать в следующие классы:
1. Факторы знания. У испытуемого может быть более или менее
четкое представление о следующем: а) свойственно ли ему в действи-
тельности или нет тестируемое поведенческое проявление (с некото-
рыми ситуациями, имплицитно подразумеваемыми в вопросе тест-оп-
росника, испытуемый мог на практике никогда не встречаться: напри-
мер, утверждение «После выигрыша в спортлото Вы покупаете больше
лотерейных билетов» подразумевает, что испытуемый, во-первых, иг-
рает в спортлото и, во-вторых, выигрывает); б) какое личностное
свойство скрывается у психолога за тем или иным конкретным поведе-
125
нием, описанным в суждении; в) как это свойство соотносится с обще-
принятыми моральными нормами и признаками социального успеха.
2. Фактор социальной желательности. Обозначает тенденцию
испытуемого давать о себе социально одобряемую информацию. Сила
этой тенденции зависит как от общей внеситуативной установки испы-
туемого на морализацию «Я-образа» и социальную успешность, так и
от того, насколько эту установку актуализирует сама ситуация тести-
рования. Однако эта тенденция не будет давать систематического ис-
кажения, если испытуемые не смогут разгадать направленность теста-
опросника и связать диагностируемое свойство с тем или иным полю-
сом социальной желательности. Таким образом, действие этого факто-
ра до некоторой степени опосредовано действием факторов знания.
Однако при диагностике личностных свойств, тесно связанных с пси-
хической «нормальностью» или «социальной успешностью», фактор
социальной желательности ответа обусловливает очень серьезные ис-
кажения.
3. Факторы индивидуальной тактики. Здесь подразумевается
действие «Я-концепции» («Я» для себя) и «Я-образа» («Я» для дру-
гих) на ситуативную тактику испытуемого в момент тестирования. Вы-
полняя тест, испытуемый всегда находится в невольном диалоге с са-
мим собой и в своих ответах на вопросы раскрывает себя не только
для других, но и для себя самого. Испытуемый стремится подтвердить
«Я-концепцию» или фальсифицировать определенный «Я-образ» с за-
данными свойствами. Как правило, в ситуациях высокого социального
риска «Я-образ» полностью доминирует: например, преступник при
экспертизе стремится прежде всего предстать больным или неприспо-
собленным к жизни, хотя в действительности ему было бы приятно ду-
мать о себе как о вполне адаптированном здоровом человеке. Точно
так же склонны подчеркивать свои трудности и проблемы клиенты,
обратившиеся за помощью к психологу или психотерапевту (чтобы вы-
звать к себе его повышенное внимание). В менее регламентированных
ситуациях, наоборот, может доминировать мотивация самопознания: в
этом случае испытуемый невольно стремится подтвердить с помощью
теста свои гипотезы о самом себе.
Заслуживают внимания и особые формы отказа испытуемого от
тестирования: позиционный стиль ответа (соглашательство или, на-