Файл: Метод тестирования в психологии и педагогике: надежность, валидность, стандартизация (Стандартизация, надежность и валидность теста).pdf

Существуют опросники, созданные для определенной сферы деятельности: вузовской и школьной психодиагностики, психодиагностики в сфере менеджментаи прочие.

Выделяют опросники состояний и опросники свойств. Они относятся к категории личностных опросников. Они имеют специальные инструкции, в которых подчеркивается, что отвечать нужно в соответствии с актуальными переживаниями, отношениями, настроениями.

Существуют также комплексные опросники.

Комплексные опросники сочетают в себе признаки опросника состояний и опросника свойств. Например, опросник Спилбергера – Ханина содержит шкалу реактивной тревожности и шкалу личностной тревожности. Первая диагностирует тревожность как состояние, вторая - для диагностики тревожности как личностного свойства.[5]

Типологические опросники создаются на основе выделения личностных типов. Описание дается через характеристику усредненного или ярко выраженного представителя типа. Примером типологических опросников являются методики Г. Айзенка., в частности, опросник выявления интроверсии-экстраверсии и нейротизма.

Диагностика способностей с помощью субъективных опросников проводится редко, так как не дает правильного результата.

Далее рассмотрим объективные тесты.. Интерпретация в таких тестах определяется на основании информации об особенностях выполнения деятельности и ее результативности. Эти показатели зависят от представлений испытуемого о себе и от мнения лица, проводящего тестирование и интерпретацию. В этом их отличие от субъективных и проективных тестов.

В зависимости от предмета тестирования существует следующая классификация объективных тестов:[18]

• тесты личности, направленные на выявление личностных особенностей;

• тесты интеллекта направлены на оценку уровня интеллектуального развития; бывают вербальные, невербальные, комплексные;

• тесты способностей, направленные на оценку возможностей человека в овладении знаниями, умениями и навыками;

• тесты креативности;

• тесты достижений предназначены для оценки уровня овладения знаниями, умениями и навыками в какой-либо конкретной деятельности; бывают действия, письменные, устные.

К тестам интеллекта относятся тесты «Логические связи», «Отыскание закономерностей», «Сравнение понятий», «Исключение лишнего», «Пиктограммы», «Классификация картинок», тест «Прогрессивные матрицы» Дж. Равена[14]

В современных тестах интеллекта в одной методике совмещаются и вербальные, и невербальные задания, например в тестах А. Бине, Р. Амтхауэра, Д. Векслера. Такие тесты являются комплексными. Самый популярный Тест Д. Векслера (WAIS). Сами тесты интеллекта вызывают споры среди ученых.[17]

Творческие способности стоят отдельно. Совокупность творческих способностей называют креативностью. В группу тестов креативности входят весьма разнообразные методики. Наиболее известны тесты Дж. Гилфорда и Е. Торренса.

В отдельную категорию выделяют проективные тесты. Здесь получение информации основано на анализе особенностей действий испытуемого с внешне нейтральным материалом, который становится объектом проекции.

Тестирование с помощью проективных методов имеет особенности. В методиках используется неоднозначный, слабоструктурированный стимульный материал, допускающий большое число вариантов восприятия и интерпретации. [18] Такие тесты должны проходить в естественной форме, испытуемый не должен знать, что это тест. Поэтому они проходят чаще в игровой форме. Такие методики используются в начале психологической работы. Достоинством проективных методик состоит в том, что его можно использовать как для взрослых, так и для детей.

Классификация проективных методов принадлежит Л.К. Франку. Он предложил различать проективные методы в зависимости от характера реакций испытуемого. В современной классификации проективных методов различают [20]

конститутивные,
конструктивные,
интерпретативные,
катартические,
экспрессивные,
импрессивные,
аддитивные методики.

Конститутивные методики предлагают испытуемому придать смысл и структуру слабоструктурированному материалу. К таким методикам относится тест Г. Роршаха с «кляксами».

Конструктивные методики подразумевают конструирование,то есть создание из оформленных деталей осмысленного целого. Например, стимульный материал методик «Деревня» и «Тест мира».

Интерпретативные методики подразумевают истолкование испытуемым какого-либо события, ситуации. Примерами являются тест тематической апперцепции (ТАТ), тесты словесных ассоциаций.

Катартические методики представляют собой осуществление игровой деятельности в специально организованных условиях. Например, психодрама Я. (Дж.) Морено.[20]

В экспрессивных методиках происходит получение информации на анализе рисунков испытуемого. Рисунки могут быть на свободную или заданную тему. Это так называемые рисуночные методики. К ним относятся «Несуществующее животное» М.З. Друкаревич, «Дом – дерево – человек» Дж. Бука, «Рисунок семьи» В. Халса, «Нарисуй человека» К. Маховер, и другие.[20]

Импрессивные методики заставляют испытуемого выбирать стимулы или ставить их по мере возрастания-убывания. Например, тест Л. Сонди. Так же существуют тесты цветового выбора, которые так же относятся к импрессивным методикам. Это тесты А.М. Эткинда, И.Л. Соломина и др.

Аддитивные методики подразумевают произвольное завершение испытуемым стимульного материала, например завершение предложения. Сюда относятся методики А. Пейна, Д. Сакса и С. Леви, и др.[18]

Классификация К. Франка подвергается критике.

Компьютерное тестирование. Это относительно молодое направление психодиагностики. Существуют достоинства таких тестов, но есть и существенные недостатки. Психологи очень осторожно относятся к ним. Можно сказать, что компьютерные тесты имеют будущее.

Опираясь на классификацию С. Розенцвейга методы психодиагностики разделены на три группы: субъективные, объективные и проективные. К каждой группе отнесены определенные тесты.

Глава 2. . Стандартизация, надежность и валидность теста

Основные критерии оценки теста - это стандартизация, надежность и валидность.

Рассмотрим каждую категорию отдельно.

В основе психологического тестирования лежит классическая теория погрешности измерений. Считается, что тест – это измерительный прибор, такой же, например, как физический прибор. И здесь существуют такие понятия как «истинный показатель» и величина случайной погрешности. Существует и «систематическая погрешность», которая может влиять на результат теста.[4]

Надежность теста. Этот параметр характеризуется устойчивостью результатов к воздействию случайных внешних и внутренних факторов. При многократном проведении теста среднее его значение будет являться «истиной » величиной параметра. Тест считается надежным, если результаты первого и последнего тестирования схожи между собой. [5]

Сам тест – это некоторое число заданий из огромного количества. Из-за этого тест может считаться приблизительно надежным. К этому требованию подходит тест, если у него коэффициент схожести результатов не менее 0,75.

Как это вычисляется.

Известно, что существуют отклонения от «истинного» тестового балла. Средняя относительная величина этого отклонения определяется как «стандартная ошибка измерения» - Se. Величина ошибки измерения указывает на неточности или ненадежности тестовой шкалы.

Исследуем формулу, где ошибка измерения – Se, надежность измерения – R. Формула

[15]

где Sx - дисперсия тестовых показателей X.

В данном случае Se – неизвестная величина, поэтому по этой формуле подсчитать надежность теста нельзя.

Для подсчета надежности применяют корреляционные методы.

Нарпимер, метод перетестирования или «ретестовой надежности».

Как он работает. Приведем пример.

В тестировании участвуют 30 человек. Сначала проводят первое исследование X, а через 2 недели повторное исследование Y. Интервал в две недели нужен для забывания ответов на тестовые вопросы, и соответственно для чистоты эксперимента.

Затем для двух рядов значений Х и Y подсчитывается, например, линейный коэффициент корреляции по формуле

[15]

- стандартные отклонения Х и Y,

Cov (X,Y) - ковариация двух переменных Х и Y.

Для исключения ошибки. Используется следующая формула

[15]

Далее высчитывается стандартное отклонение в тесте и сравнивается с корреляцией ретеста. По результатам выделяется ошибка измерения и делается вывод о надежности теста.

Валидность теста. Валидность предназначена для измерения принадлежности теста к измерению главного измеряемого свойства. Чем больше на результат выполнения влияет измеряемое свойство, тем тест валиднее.

Существуют следующие виды валидности теста.[17]

Очевидная валидность.
Конкретная валидность (конвергентная – дивергентная валидность).
Прогностическая валидность.
Содержательная валидность.
Конструктная валидность.

При очевидной валидности, у испытуемого складывается впечатление, что он измеряет то, что должен измерять.

Конкретная валидность характеризуется тестами, которые сходны с тестами, измеряющими похожие свойства.

Прогностическая валидность. Тест должен соответствовать отдаленным по времени внешними критериями.

При содержательной валидности тест должен охватывать всю область изучаемого поведения.

Конструктная валидность предполагает полное описание измеряемой переменной, выдвижение системы гипотез о связях ее с другими переменными, научное экспериментальное подтверждение этих гипотез.

Для установления «внутренней » валидности теста нужно применить метод факторного анализа. Факторный анализ, позволяет проанализировать структуру связей показателей исследуемого теста с другими известными и скрытыми факторами, выявить общие и специфические для группы сопоставляемых тестов факторы, степень их представленности в результатах, т. е. определить факторный состав и факторные нагрузки результата теста.[17]

В научных исследованиях для определении валидности используют специальные лабораторные исследования. Они трудоемки.

На практике очень часто в качестве критерия валидности используются прагматические критерии. К ним относятся показатели эффективности той деятельности, для которой осуществляется тестирование.

Очень часто в качестве критерия валидности используется экспертная оценка. Например, для того чтобы убедиться, что короткий тест на измерение уровня дисциплинированности валиден, проводится опрос учителей об уровне дисциплинированности. После этого сравниваются результаты теста и экспертный рейтинг учеников по дисциплинированности. Такой метод еще называют статистическим.

После проведения теста производится расчет, например, простейшей корреляции между тестом и критерием.

Таблица 1. Простейшая корреляция между тестом и критерием [18]

Элемент «a» – это число испытуемых, попавших в высокую группу по тесту и по критерию

элемент «b» – число испытуемых, попавших в высокую группу по тесту, но в низкую группу по критерию.

При полной валидности теста «b» и «с» должны быть равны 0. Таким образом тест не должен выдавать ошибки.[19]

Математическое выражение критерия валидности (коэффициент Гилфорда)

Меру совпадения между крайними группами по тесту и по критерию оценивают с помощью самого простого Фи-коэффициента Гилфорда:

[19]

Значимость фи-коэффициента определяется с помощью критерия .[19]

Если вычисленное значение меньше табличного с одной степенью свободы, пункт признается неустойчивым.

Использование фи-коэффициента удобно потому, что он одновременно оценивает степень оптимальности данного пункта теста по силе вопроса или трудности задания.

Определение прогностической валидности осуществляется только крупным научно-методическим центрам. К исследованию привлекают более 300 человек.

Стандартизация теста заключается в приведении процедуры оценок к общепринятым нормативам. Стандартизация приводит тестовые нормы, в систему шкал с характеристиками распределения тестового балла для различных тестов.

Линейная стандартизация тестового балла производится по формуле

[19]

где Z - стандартный балл на стандартной шкале Z с центром 0 и отклонением 1,

Смотрите также файлы

Одаренные дети: проблемы, поиски, пути воспитания и обучения (Определение понятий способность, одаренность).pdf

Духовно-нравственное развитие младших школьников посредством участия последних в творческой деятельности.pdf

Исследование особенностей сюжетно-ролевой игры дошкольников (Организация игры в старшей и подготовительной группах).pdf

ВЛИЯНИЕ СЮЖЕТНО- РОЛЕВОЙ ИГРЫ НА РАЗВИТИЕ ЛИЧНОСТИ ДЕТЕЙ ДОШКОЛЬНОГО ВОЗРАСТА (История возникновения ролевой игры).pdf

Метод эксперимента и особенности его использования в психологическим исследовании.pdf

Файл: Метод тестирования в психологии и педагогике: надежность, валидность, стандартизация (Стандартизация, надежность и валидность теста).pdf

Глава 2. . Стандартизация, надежность и валидность теста

Смотрите также файлы

Информация

Списки файлов

Дополнительно