ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 29.11.2023
Просмотров: 1219
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
СОДЕРЖАНИЕ
607
П
РОБЛЕМЫ И ПОТЕНЦИАЛЬНЫЕ
ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ ТЕСТОВ
Проведение тестирования консультантами во многом сходно с тестирова- нием, выполняемым психологами (Bubenzer, Zimpfer & Mahrle, 1990). Критиче- ским фактором для успешного применения тестирования в интересах клиента и всего общества является не только профессиональная принадлежность того, кто его применяет, но и — даже в большей степени — способ проведения тестиро- вания (Harris, 1994).
Тесты могут применяться по одному или блоком (так называемая батарея тестов). Кронбах (Cronbach, 1979) утверждает, что тестовые батареи не пред- ставляют собой ценности, если интерпретацией их результатов не занимаются компетентные, хорошо образованные консультанты. То же самое справедливо и для отдельных тестов. Многие из проблем, связанных с тестированием, обычно имеют отношение к выбору способа применения и интерпретации, а не к само- му тесту. Как бы то ни было, и применение, и интерпретация тестов до сих пор серьезно критикуются (Talbutt, 1983).
Шерцер и Стоун (Shertzer & Stone, 1980) поддерживают мнение, что оп- поненты тестирования в целом правы, и приводят следующие доводы.
1. Тестирование поддерживает зависимость клиента как от консультанта, так и от внешнего источника информации, необходимой для решения тестовой задачи.
2. Результаты тестирования создают предвзятое отношение консультанта к клиенту.
3. Результаты тестирования не являются достаточно валидными и надеж- ными, что сильно ограничивает их значимость.
Другие критики приходят к заключению, что тесты являются необъек- тивными и пристрастными, измеряют иррелевантные навыки, применяются ме- ханистически, не выявляют талант, вторгаются в личную жизнь, их результаты могут быть сфабрикованы и стимулируют нежелательную конкуренцию (Pres- cott, Cavatta & Rollins, 1977; Shertzer & Linden, 1979; Talbutt,
19.83). «Переоцен- ка результатов тестирования, и особенно отказ от других источников информа- ции о человеке, является одной из наиболее серьезных проблем неправильного применения тестов» (Elmore et. al, 1993, p. 76). Еще один аргумент критиков со- стоит в том, что тесты по сути своей регрессивны, хотя и применялись чаще для предсказания, чем для-наблюдения или самоизучения (Goldman, 1994b).
Тестирование при работе с представителями различных меньшинств — это область, вызывающая особенно много разногласий и чреватая случаями не- правильного применения тестов (Suzuki & Kugler, 1995; Suzuli, Meller & Ponte- rotto,
1996). Чтобы результаты тестирования имели какую-либо ценность, в применяемых методиках должно учитываться влияние опыта человека, имею- щего другие культурные, этнические и расовые корни. Оукленд (Oakland, 1982)
608 обращает внимание на то, что тестирование может оказаться негуманным ме- роприятием и что учащиеся, принадлежащие к меньшинствам, могут (по ре- зультатам тестирования) напрасно тратить годы, занимаясь по неэффективным, непригодным для них программам. Чтобы избежать проблем, связанных с куль- турными различиями, ААС разработала мультикультуральные стандарты оцен- ки (Prediger, 1993). Этические правила применения тестов содержатся также в
«Этических стандартах Американской ассоциации консультирования» (Ethical
Standards of the American Counseling Association).
Эти стандарты, как и стандар- ты, разработанные другими профессиональными ассоциациями, предназначены для предотвращения некорректного применения тестов при работе с меньшин- ствами (Hansen, 1994). Предубеждения при оценке могут быть расценены как акты, ведущие к преждевременному решению в результате либо бездействия, либо излишнего действия (Chernin, Holden & Chandler, 1997).
Успешность тестирования зависит от сенситивности, способностей и зна- ний консультантов, которые отбирают, проводят и интерпретируют тесты. «В общем случае консультанты обязаны придерживаться эмпирического подхода к своему инструментарию, особенно если для применяемых тестов нет установ- ленных норм и не проведена тщательная проверка их валидности» (Carlson,
1989, р. 489). Если консультанты в процессе отбора тестов не будут учитывать многочисленные критерии, они, скорее всего, допустят множество ошибок, ко- торые причинят вред как им самим, так и их клиентам. Чтобы не допускать та- ких ситуаций, некоторые консультанты привлекают к отбору тестов самих кли- ентов.
Лирнер (Learner, 1981) и Оукленд (Oakland, 1982) отмечают, что в целом отношение населения к тестированию положительное, даже среди меньшинств, что, возможно, обусловлено верой людей в полезность тестирования. С точки зрения широкой общественности, главная функция тестов — помочь клиентам принять наилучшее решение относительно своего будущего. Тесты могут также оказаться полезными по целому ряду причин (Shetzer & Stone, 1980):
• помогают клиентам обрести самопонимание;
• помогают консультантам решить, компетентны ли они заниматься про- блемами клиентов;
• помогают консультантам лучше понять клиентов;
• помогают консультантам определить, какие методы консультирования окажутся наиболее приемлемыми;
• помогают консультантам предвидеть будущие успехи клиентов в вы- бранной области деятельности, например работе в качестве механика, худож- ника или учебе в высшей школе;
• помогают консультантам стимулировать расширение круга интересов у своих клиентов;
• помогают консультантам оценить результаты консультирования.
1 ... 62 63 64 65 66 67 68 69 ... 83
К
АЧЕСТВА ХОРОШИХ ТЕСТОВ
Все тесты различаются между собой, однако существуют некоторые об-
609 щие качества, характеризующие успешно работающие тесты. К числу наиболее важных качеств следует отнести валидность, надежность, а также стандартизи- рованность и наличие норм, которые облегчают интерпретацию показателей
(Alken, 1997; Cronbach, 1990).
Валидность. Валидность является, бесспорно, наиболее важной характе- ристикой теста. Она представляет собой «критерий, показывающий, насколько тест действительно измеряет то, что он должен измерять» (Anastasi, 1982, р. 27).
Если тест не выполняет этой функции, он в основном бесполезен. Валидность теста определяется путем сравнения его результатов с другими независимыми показателями. Следовательно, если тест предназначен для определения вероят- ности успешной деятельности в выбранной сфере, например в медицине, юрис- пруденции или консультировании, показатели тестирования сопоставляются с оценками успешности деятельности (такими, как ранги и оценки, поставленные инструкторами), полученными после того, как тестируемый индивид закончит свое обучение. Если показатели тестовой методики имеют высокую положи- тельную корреляцию с такими независимыми показателями успешности, счита- ется, что методика обладает высокой валидностью. v
Существует три типа валидности: содержательная, конструктная и валид- ность по критерию (Anastasi, 1988,1992; Kaplan & Saccuzzo, 1982). Содержа-
тельная валидность, которую иногда называют собственно валидностью, явля- ется индикатором степени, в которой тест в действительности измеряет то, для чего он предназначен (Alken, 1997). Более существенно, что содержательная валидность отражает представленность в тесте модели того истинного фактор- ного пространства, которое предполагается оценивать. Как правило, содержа- тельная валидность связывается с тестами достижений, склонностей и способ- ностей.
Конструктная валидность, наиболее общий тип валидности, показывает
«степень, в которой тест можно считать измеряющим теоретический конструкт или черту», для измерения которой он предназначен, например эмпатию или интеллект (Anastasi, 1982, р. 144). Многое зависит от определения конструкта автором теста, но в целом конструктная валидность применима к опросникам по выявлению черт личности и интересов.
Критериальная валидность относится к сравнению тестовых показателей с результатами фактического выполнения человеком определенных действий за такое же время и в тех же условиях. Например, тест, который измеряет мотор- ные навыки человека, может оказаться невалидным относительно способности этого человека печатать. Если критерий доступен во время тестирования, то определяется конкурентная валидность. В случаях, когда критерий недоступен до окончания тестирования, измеряется прогностическая валидность (Aiken,
1997). В консультировании широко применяются две хорошо известные, осно- ванные на критериях методики: Миннесотский многопрофильный личностный опросник-2 (ММР/-2) — тест с конкурентной валидностью (Butcher & Williams,
1992), и пересмотренный Опросник профессиональных интересов Стронга
(5VII) — тест с прогностической валидностью (Osborn, Brown, Niles & Miller,
1997).
610
Надежность. Надежность обычно определяется как мера того, насколько постоянны результаты при повторном тестировании с помощью той же самой или эквивалентной методики (Anastasi, 1988; Cronbach, 1990). Хотя надежность и связана с валидностью, тестовый показатель может быть надежен, но не ва- лиден.
Существует три традиционных способа определения надежности.
•
Тест-ретест. Один и тот же тест предлагается снова через период вре- мени.
•
Параллельные формы. Применяются две эквивалентные формы одного теста.
•
Анализ внутренней консистентности. Сравниваются показатели двух случайно выбранных частей теста.
Тесты сами по себе не являются ни надежными, ни ненадежными. Ско- рее, «надежность относится к результатам, полученным при помощи инстру- мента оценивания, а не к самой методике... Таким образом ... уместно говорить о надежности "тестовых показателей" или "измерений", а не "теста" или "мето- дики"» (Gronlund & Linn, 1990, p. 78).
Стандартизация и нормы. Под стандартизацией понимается создание однородных условий, в которых проводится тестирование и регистрируются результаты (Aiken, 1997). Стандартизация делает возможным сравнение резуль- татов тестирований индивида, проводившихся в разное время, а также сравне- ние показателей различных людей. Нормы, или средние показатели, гаранти- руют правомерность сравнения результатов отдельных людей между собой и со стандартами для данных групп (Kaplan & Saccuzzo, 1997). Тестовые нормы имеют свои ограничения, возможны случаи их неправильного использования.
Например, основная критика в адрес некоторых тестов связана с тем, что их нормы были установлены для представителей преобладающей культурной группы населения; следовательно, для меньшинств они могут оказаться дис- криминационными и вредоносными (Talbutt, 1983). Консультанты должны тща- тельно исследовать процедуры нормирования тестов, и, кроме того, они долж- ны устанавливать свои локальные нормы. Таким способом можно свести к ми- нимуму возможные предубеждения и некорректное использование тестирова- ния.
К
ЛАССИФИКАЦИЯ ТЕСТОВ
Существует целый ряд классификаций тестов. Шертцер и Стоун (Shertzer
& Stone,
1981) приводят семь из них.
1.
Стандартизированные/нестандартизированные тесты. Стандартизи- рованные тесты применяются и обрабатываются согласно определенным пра- вилам (например, тест самонаправленного изучения (Self-Directed Search)) в противоположность тем, которые не имеют такой регламентации (например, экспериментальный проективный тест (experimentalprojective test)).
2. Индивидуальные/групповые тесты. Методики, рассчитанные на работу только с одним человеком единовременно (например, тестовая оценочная бата-
611 рея Кауфмана для детей (Kaufman Assessment Battery for Children) (Kamphaus,
Beres, Kaufman & Kaufman,
1996)), противопоставляются тем, которые могут применяться в группе (например, Миннесотский школьный опросник на выяв- ление аттитюдов (Minnesota School Attitude Survey) (Callis, 1985)).
3.
Тесты на скорость/силу: тесты, которые должны быть выполнены за определенный, установленный инструкцией, период времени (таковы большин- ство тестов достижений), в противоположность таким, которые предоставляют испытуемому неограниченное время для того, чтобы продемонстрировать име- ющиеся знания (многие индивидуально применяемые тесты интеллекта).
4.
Тесты, включающие выполнение деятельности/тесты «бумаги и ка-
рандаша»: тесты, требующие манипуляций с объектами (например, субтест детской шкалы интеллекта Векслера на складывание фигур (WISC-III)) проти- вопоставляются тестам, в которых обследуемые отмечают правильные ответы на бланке или дают письменные ответы (например, анкеты, направленные на выявление зависимости).
5.
Объективные/субъективные тесты. Тесты, не требующие развернутого рассуждения респондента (предполагающие короткий ответ: «истинно — лож- но», «соответствует или нет» или выбор из нескольких альтернатив (Aiken,
1997)), в противоположность тем, которые требуют, чтобы респондент выносил суждение (например, Словарный субтест пересмотренного теста Векслера для взрослых ( WAIS-K) (Wechsler, 1981)).
6.
Тесты с установкой на достижение максимального результата в
противоположность тестам на выявление типичной деятельности', тесты, которые требуют от испытуемых максимального результата (такие, как тесты интеллекта и специальных способностей), противопоставляются тестам, в кото- рых определяется, что субъект предпочитает делать или обычно делает (тесты на выявление интересов или установок).
7.
Тесты, имеющие нормативы/базирующиеся на критериях', тесты, ко- торые сравнивают показатели индивида с показателями группы (такие, как ин- теллектуальные тесты или тесты достижений), противопоставляются тестам, которые измеряют показатели индивида по сравнению с желательным уровнем или стандартом (например, тест на скорость чтения (Aiken, 1997; Cronbach,
1990))
Еще одно основание, по которому могут быть классифицированы тесты и которое является даже более важным для консультантов, — это «цель, для ко- торой они разработаны, или аспекты поведения, которые они представляют»
(Shertzer & Stone, 1981, p.
242). В соответствии с этим Шертцер и Стоун пред- лагают различать шесть категорий тестов: тесты интеллекта, способностей, до- стижений, интересов, а также профориентационные и личностные. Существует и другая система классификации, включающая следующие категории: образо- вательные, профессиональные или личностные аспекты консультирования
(Elmore & Roberge,
1982). Классификационная схема, предложенная Сильваниа
(Sylvania,
1956), группирует тесты согласно частоте использования: тесты на интеллект и школьные способности, тесты на профессиональные (и другие) способности и тесты достижений и диагностические. Все эти системы класси-