Файл: Бодалев А.А. - Общая психодиагностика.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.10.2020

Просмотров: 8078

Скачиваний: 53

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

121

цедуры  возникают  при  наличии  группы  испытуемых, тесно  общаю-

щихся между собой; тех, которые могут одновременно побывать и ис-

пытуемыми по отношению к тесту, и оценщиками по отношению друг к
другу. В  отечественной  литературе  эта  процедура  получила  со-

кращенное обозначение ГОЛ - «групповая оценка личности» (Кузьмин
Н. В., Семенов В. С., 1977).

Для  того  чтобы  групповая  оценка  личности  была  источником

действительно валидной информации, оценщики должны согласованно

оценивать  испытуемых. Если в  оценках разных оценщиков  нет согла-
сованности, то  это  означает, что  либо  оцениваемое  свойство  не  про-

явилось  у  объекта  оценивания, либо  оценщики  по-разному  проинтер-

претировали  инструкцию. Для  измерения  согласованности  должна
быть составлена таблица с оценками (табл. 6).

Таблица 6

Оценщики
Испытуе-

мые

О

1

О

2

О

k

å

И

1

x

11

x

12

x

1k

C

1

И

2

x

21

x

22

x

2k

C

2


И

n

x

n1

x

n2

x

nk

C

n

Методы  анализа  данных, содержащихся  в  такой  таблице, фор-

мально совершенно эквивалентны тем методам, которые применяются

для обработки таблиц «испытуемые - пункты» (см. раздел 3.1), В ча-
стности, суммы  по  строкам  дают  суммарные  баллы, полученные  каж-

дым испытуемым у всех оценщиков. Таким образом, оценщики в дан-
ном  случае  оказываются  формально  в  роли  пунктов  теста. Рассчиты-

вая попарные корреляции между различными столбцами этой таблицы,
можно  получить  коэффициенты  согласованности  для  отдельных  пар

оценщиков. Глобальной мерой согласованности оценщиков может слу-
жить коэффициент надежности а Кронбаха - см. формулу (3.2.8).

Если же групповая оценка не обнаруживает надежности, то она

не  может  использоваться  в  качестве  критерия  валидизации  при  про-
верке валидности теста.


background image

122

Эмпирическое  значение  коэффициента  валидности  рассчитыва-

ется как линейная или ранговая корреляция между двумя рядами зна-

чений: тестовыми баллами и суммарными баллами экспертной оценки.
Это  эмпирическое  значение  при  наличии  невысокого  коэффициента

надежности критерия корректируют по формуле

c

a

cx

r

tx

r

=

(3.3.1)

где

cx

r

 - эмпирическая корреляция с критерием;

а

с

 — надежность критерия;

r

tx

 - корреляция  с «истинным» критерием («истинная» валид-

ность теста).

Анализ пунктов по критерию валидности. Валидность всего теста

целиком  зависит  от  валидности  входящих  в  него  пунктов. Макси-

мальная  валидность  достигается  за  счет  отбора  таких  пунктов  из  пи-
лотажной  батареи, которые, обладая  значимой  корреляцией  с  крите-

рием, минимально  коррелируют  между  собой. Отбор  пунктов  именно
по критерию валидности обеспечивает максимальную прагматическую

эффективность  теста. Вручную (на  калькуляторе) такой  отбор  можно
произвести, рассчитав 

бисериальную 

корреляцию (или 

фи-

корреляцию) критерия с каждым пунктом из пилотажной батареи, - см.
формулы (3.2.15) и (3.2.17). Компьютер позволяет использовать более

эффективный  алгоритм, основанный  на  анализе  частных  корреляций

между  критерием  и  пунктами  и  предполагающий  построение  уравне-
ния  множественной  регрессии (Аванесов  В. С., 1982, с. 153-157). В

результате  в  таком  уравнении  каждый  пункт  получает  весовой  коэф-
фициент

1

, количественно  выражающий  его  вклад  в  критерий, не  сво-

димый  к  вкладу  других  пунктов, т. е. поиск  оптимального  набора
пунктов  автоматизируется. X. Гаррет  приводит  следующую  яркую  ил-

люстрацию  эффективности  алгоритма, позволяющего подобрать  опти-
мальный набор пунктов. Пусть имеется 20 пунктов, каждый из которых

имеет  корреляцию  с  критерием  порядка 0,30. Оказывается, если  эти

пункты в среднем коррелируют друг с другом на уровне

ij

r

 = 0,60, то

1

 Этот весовой коэффициент и используется как ключ к данному пункту в новой, скорректиро-

ванной версии теста.


background image

123

множественная корреляция суммарного тестового показателя с крите-

рием  равняется 0,38, если  же  г

а

 = 0,30, множественная  корреляция

повышается до 0,52. Наконец, при r

tj

= 0,10

эффективность (валидность) теста  достигает  весьма  высокого

уровня: 0,79. Те  же  самые  проблемы  возникают  при  подборе  опти-
мальной батареи тестов, направленных на прогнозирование какого-то

одного  социально  ценного  показателя (успеваемость, производитель-
ность труда и т. п.).

Как уже указывалось в разделе 3.1, тест, обладающий высокой

критериальной  валидностью  должен  давать  монотонную  зависимость

величины критерия от тестового балла (см. рис. 6). Для того чтобы по-

лучить монотонную линию регрессии, психодиагност должен включить
в тест X только такие пункты, которые являются валидными по крите-

рию  С.  В  противном  случае  на  кривой  неминуемо  появятся  провалы

1

.

Крутизну линии регрессии можно существенно повысить за счет наце-

ленного отбора из первоначальной батареи только таких заданий, ко-
торые  обладают  значимо  высокой  корреляцией (или  регрессионным

коэффициентом в уравнении множественной регрессии) с критерием.

После отбора валидных пунктов должна быть произведена пере-

крестная валидизация (см. Анастази А., 1982, с. 197). В чем ее смысл?
Если  при  анализе  корреляций  между  батареей  из 200 заданий  и  ка-

ким-то  критерием  получают 10 заданий, значимо  коррелирующих  е

критерием на уровне ошибки р < 0,05, то это может быть следствием
чисто случайного совпадения (сравните 10/200=0,05). Чтобы убедить-

ся в том, что отобранные пункты теста действительно могут различать
(или прогнозировать) критерий, нужно рассмотреть, как  коррелируют

с  критерием  эти  пункты  на  другой  выборке,  которая  не  использо-
валась при их отборе.

Простой метод реализации принципа перекрестной валидизации

состоит в том, что вся выборка делится на две случайные половины и

производится  раздельный  расчет  корреляций  пунктов  с  критерием

для-. каждой половины выборки. Если выделенные (значимые) пункты
совпадают, то перекрестную валидизацию можно считать удачной.

1

 Некоторые незначительные локальные провалы при наличии общей высокой регрессии (высо-

кий контраст крайних Р от X) можно устранить, увеличивая интервал равнозначности.


background image

124

Метод  критериального  тестирования  очень  трудоемок. .Прак-

тически невозможно построить критериальный тест за счет одной ста-

тистики, сколь  бы  мощными  выборками  и  батареями  заданий  мы  ни
располагали. Необходима  работа  над  содержательной  валидностью

заданий. Критериальное  тестирование  имеет  ограниченное  примене-
ние в задачах построения методик с широкой областью применения.

Следует еще раз подчеркнуть, что анализ валидности отдельных

пунктов  служит  не  только  прагматическим  целям,  но  может  и  должен

служить  целям  углубления  представлений  о  содержательно-
теоретическом  смысле  измеряемого  свойства: на  основании  содержа-

тельного анализа пунктов, отобранных по критерию, психолог уточня-

ет  и  корректирует  свою  первоначальную  теоретическую  схему, свое
понимание измеряемого свойства.

Достоверность  самоотчета. Рассматривая  общую  проблемы  ва-

лидности целесообразно выделить вопрос об обеспечении валидности

процедур  стандартизованного  самоотчета. Сюда  относятся  различные
техники  шкалирования, классифицирования, сравнения  и  тест-

опросники. Вербальная форма тестового материала порождает у испы-
туемого определенные встречные гипотезы о цели тестирования. Если

ситуация  диктует  испытуемому  необходимость  фальсификации  отве-
тов, то он редко отказывается от этой возможности.

Валидность — характеристика  любых  измерений, в  том  числе  и

физических. Специфические  проблемы  валидности, связанные  с  ак-
тивностью  человека  как  объекта  психодиагностики, целесообразно

обозначить особым образом - проблемы обеспечения достоверности.

Психологические  факторы, от  которых  зависит  достоверность

самоотчета, условно можно сгруппировать в следующие классы:

1.  Факторы знания. У испытуемого может быть более или менее

четкое представление о следующем: а) свойственно ли ему в действи-
тельности  или  нет  тестируемое  поведенческое  проявление (с  некото-

рыми  ситуациями, имплицитно  подразумеваемыми  в  вопросе  тест-оп-

росника, испытуемый мог на практике никогда не встречаться: напри-
мер, утверждение «После выигрыша в спортлото Вы покупаете больше

лотерейных билетов» подразумевает, что испытуемый, во-первых, иг-
рает  в  спортлото  и, во-вторых, выигрывает); б) какое  личностное

свойство скрывается у психолога за тем или иным конкретным поведе-


background image

125

нием, описанным в суждении; в) как это свойство соотносится с обще-

принятыми моральными нормами и признаками социального успеха.

2.  Фактор  социальной  желательности. Обозначает  тенденцию

испытуемого давать о себе социально одобряемую информацию. Сила

этой тенденции зависит как от общей внеситуативной установки испы-
туемого на морализацию «Я-образа» и социальную успешность, так и

от  того, насколько  эту  установку  актуализирует  сама  ситуация  тести-
рования. Однако эта тенденция не будет давать систематического ис-

кажения, если испытуемые не смогут разгадать направленность теста-
опросника и связать диагностируемое свойство с тем или иным полю-

сом социальной желательности. Таким образом, действие этого факто-

ра  до  некоторой  степени  опосредовано  действием  факторов  знания.
Однако при  диагностике  личностных свойств, тесно связанных с  пси-

хической «нормальностью» или «социальной  успешностью», фактор
социальной желательности ответа обусловливает очень серьезные ис-

кажения.

3.  Факторы  индивидуальной  тактики. Здесь  подразумевается

действие «Я-концепции» («Я» для  себя) и «Я-образа» («Я» для  дру-
гих) на ситуативную тактику испытуемого в момент тестирования. Вы-

полняя тест, испытуемый всегда находится в невольном диалоге с са-
мим  собой  и  в  своих  ответах  на  вопросы  раскрывает  себя  не  только

для других, но и для себя самого. Испытуемый стремится подтвердить

«Я-концепцию» или фальсифицировать определенный «Я-образ» с за-
данными свойствами. Как правило, в ситуациях высокого социального

риска «Я-образ» полностью  доминирует: например, преступник  при
экспертизе стремится прежде всего предстать больным или неприспо-

собленным к жизни, хотя в действительности ему было бы приятно ду-
мать  о  себе  как  о  вполне  адаптированном  здоровом  человеке. Точно

так  же  склонны  подчеркивать  свои  трудности  и  проблемы  клиенты,
обратившиеся за помощью к психологу или психотерапевту (чтобы вы-

звать к себе его повышенное внимание). В менее регламентированных

ситуациях, наоборот, может доминировать мотивация самопознания: в
этом  случае  испытуемый  невольно  стремится  подтвердить  с  помощью

теста свои гипотезы о самом себе.

Заслуживают  внимания и особые  формы отказа  испытуемого  от

тестирования: позиционный  стиль  ответа (соглашательство  или, на-