Файл: Метод тестирования в психологии и педагогике: надежность, валидность, стандартизация (Виды тестирования и их особенности).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 19.06.2023

Просмотров: 749

Скачиваний: 14

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Далее надежность теста рассчитывалась по формулам Спирмена – Брауна и Рюлона.

Бинарная матрица результатов тестирования была разбита на две части: первую половину матрицы составили ответы по нечетным заданиям, вторую  – по четным. Были подсчитаны индивидуальные баллы студентов по нечетным заданиям xi и индивидуальные баллы по четным заданиям yi, а также их разность в соответствующих строках. Подсчитан коэффициент корреляции Пирсона для двух половин теста по формуле (1), и полученное значение коэффициента надежности теста скорректировано по формуле Спирмена – Брауна (2).

Чтобы использовать формулу Рюлона (4), вычислена дисперсия разностей между результатами каждого испытуемого по обеим половинам теста.

И, наконец, надежность теста была определена по формуле (5) с помощью корреляционной матрицы тестовых заданий, фрагмент которой приведен в табл. 2. Корреляционная матрица представляет собой квадратную матрицу размерности 22×22, симметричную относительно главной диагонали. В ячейках таблицы содержатся коэффициенты корреляции тестовых заданий между собой, вычисленные по формуле (1). По таблице был определен средний коэффициент корреляций для каждого задания, затем средний коэффициент корреляций по всему тесту R.

Таблица 2

Корреляционная матрица

Порядковый номер студента

Значения коэффициентов корреляции

1

2

3

4

5

1

1,000

0,024

0,024

0,279

0,398

2

0,024

1,000

0,148

0,373

–0,146

3

0,024

0,148

1,000

0,053

0,167

4

0,279

0,373

0,053

1,000

–0,098

5

0,398

–0,146

0,167

–0,098

1,000

Результаты расчета коэффициента надежности теста с помощью разных методов представлены в табл. 3.

Таблица 3

Коэффициенты надежности теста

Используемая формула

Значение

По формуле Кьюдера – Ричардсона

0,7023

По формуле Спирмена – Брауна

0,7544

По формуле Рюлона

0,7538

С помощью корреляционной матрицы

0,7238

Нижним пределом значения коэффициента надежности принято считать показатель 0,7. Если значение коэффициента надежности ниже, то надежность теста считается неудовлетворительной, так как возникает большая погрешность измерений. Анализ результатов свидетельствует о том, что надежность разработанного теста является минимально допустимой, некоторые тестовые задания необходимо заменить. Качество диагностических материалов является одним из ключевых моментов контроля знаний. Во избежание неадекватной оценки знаний необходимо использовать только статистически обоснованные тестовые материалы, обладающие достаточным уровнем надежности и валидности.


Подводя итоги настоящей главы, следует отметить, что тесты получили широкое распространение и развитие: они способствуют объективности оценок, независимо от субъективного мнения лица, проводящего исследование. Тесты позволяют оценить человека соответственно цели исследования, дают возможность сравнить информацию, полученную разными исследователями. Продолжает развиваться нарастающими темпами тестирование, оказывает эффективное содействие в решении всё более широкого круга вопросов в различных сферах повседневной жизни. Тесты применяются в учебных заведениях, на промышленных предприятиях, при индивидуальном консультировании, для определения результатов и воздействия социальных программ.

ГЛАВА 2 ОСНОВНЫЕ ДОСТОИНСТВА И НЕДОСТАТКИ МЕТОДА ТЕСТИРОВАНИЯ

2.1 Требования к тестам

С самого своего возникновения методы тестов мыслились как психометрическое орудие, характеризующее уровень развития психических процессов на языке объективных измерений. Его разработали для отбора неполноценных детей во вспомогательные школы, он в дальнейшем получил широкое распространение для других целей, что послужило поводом для его критики. Несмотря на критику, нет причин отказываться от метода тестов. Нужно только понимать границы его применения и психологической интерпритации.

В основном тесты служат для целей испытания, чтобы выявить, насколько психические качества испытуемого соответствуют выявленным психическим нормам и стандартам [4, с.9].

Тесты личностные, используемые в клинической диагностике, принадлежат к типу проективных – тесты Роршаха, тест тематической апперцепции, детский тест на апперцепцию, тест Розенцвейга, тест на завершение незаконченных предложений. Типичный тест состоит из серии кратких заданий, на выполнение каждого из которых требуется, как правило, не более полуминуты, а весь тест занимает не более часа. Тестированию одновременно подвергается сразу группа испытуемых, происходит значительная экономия времени на сбор данных [17, с.45].

Думается, что личностные тесты и тесты достижений различаются на основе того, какие из свойств личности подвергаются тестированию. Тесты достижений это тесты успеваемости, тесты творческих возможностей, тесты способностей, сенсорно-моторные тесты и тесты интеллекта. Объективные тесты включают в себя большинство тестов достижений и психофизиологических тестов. Это отличается от субъективных тестов, при выполнении которых испытуемый может не предполагать о действительной цели исследования. Проективные тесты в результате дают ответ, который не может быть расценен как правильно или не правильно, а должен быть дан свободный ответ, должен быть такой способ построения тестового задания, при котором испытуемый должен получить ответ, а не выбирать его из заданного списка.


Согласно Р. С. Немову тестами в психологии называют стандартизированные методики психодиагностики, позволяющие получать сопоставимые количественные и качественные показатели степени развитости изучаемых свойств [17, с. 45].

Полагаем, что к тестам предъявляются особые требования. Первое из них это социокультурная адаптированность теста. Второе требование к тестам это простота формулировок и однозначность тестовых заданий. Третье требование это ограниченное время выполнения тестовых заданий. Четвертое требование это наличие тестовых норм для данного теста. Тесты представляют собой стандартные наборы заданий и материалов, с которыми работает испытуемый. Стандартна процедура предъявления заданий: они даются в определенной последовательности, время выполнения и оценка результатов регламентируются [17, с. 45].

Думается, что личностные тесты и тесты достижений различаются на основе того, какие из свойств личности подвергаются тестированию. Тесты достижений это тесты успеваемости, тесты творческих возможностей, тесты способностей, сенсорно – моторные тесты и тесты интеллекта. Объективные тесты включают в себя большинство тестов достижений и психофизиологических тестов. Это отличается от субъективных тестов, при выполнении которых испытуемый может не предполагать о действительной цели исследования. Проективные тесты в результате дают ответ, который не может быть расценен как правильно или не правильно, а должен быть дан свободный ответ, должен быть такой способ построения тестового задания, при котором испытуемый не должен выбирать его из заданного списка и должен получить ответ.

Традиционно психометрическая часть обработки результатов обследования с помощью рассматриваемых шкал предусматривает подсчет первичных оценок по каждому из применявшихся вербальных и практических субтестов. Согласно таблицам переходов «сырых» показателей в оценки шкальные могут быть получены стандартные оценки результатов выполнения каждого отдельного субтеста. Эти данные могут быть представлены в виде профиля. Оценки отдельных субтестов рассчитаны по шкале с характеристиками: М = 10, s = 3. По суммам «сырых» оценок (отдельно вербальной и невербальной частей теста) с помощью специальных таблиц определяются шкальные оценки IQ-вербального, IQ-невербального и общего IQ-показателя. Оценки по этим трем показателям выражены в единицах IQ-показателя стандартного (М = 100, s = 15) [11, с. 69].

Интерпретация IQ-показателей по Векслеру как видно из таблицы 2 (см. Приложение 2) проводится в соответствии со схемой. При конструировании шкал Д. Векслер исходит из стремления отразить в заданиях теста интеллектуальные факторы, от которых зависит эффективность проявления интеллекта.


Думается, характеристика функциональной направленности отдельных групп, заданий шкал измерения интеллекта Векслера, как видно из таблицы 3 (см. Приложение 3) влияют на результаты отдельных субтестов.

Разработка шкал измерения интеллекта Векслера опиралась на тщательную стандартизацию. Нормативная выборка для WAIS состояла из 1700 испытуемых с равным количеством мужчин и женщин. Испытуемые в возрасте 16 – 64 лет были распределены по семи возрастным уровням. Предпринимались разные меры по обеспечению репрезентативности выборки. Для пожилых людей были установлены дополнительные нормы путем тестирования выборки лиц пожилого возраста из 470 человек. Стандартизация шкальных показателей отдельных субтестов осуществлялась на группе из 500 испытуемых (возраст от 20 до 34 лет), входивших в выборку стандартизации. Выборка стандартизации WISC-R состояла из 100 мальчиков и 100 девочек в каждом возрастном годовом интервале от 6,5 до 16,5 лет (общее количество испытуемых – 2200). Аналогично процедуре стандартизации WAIS для обеспечения максимальной репрезентативности выборка была стратифицирована на основе данных переписи населения. Шкала WPPSI была стандартизирована на аналогичной выборке из 1200 детей (по 100 мальчиков и 100 девочек в каждой полугодовой возрастной группе в диапазоне от 4 до 6,5 лет) [11, с. 69].

Тесты знаний апеллируют, прежде всего, к стандартному применению готовых знаний. Отсутствие возможности раскрыть свою индивидуальность при наличии стандартных, заданных ответов ничем невосполнимый недостаток метода тестов. А тесты достижений, адаптированные на жизненно важном материале, выполнены в форме стандартного набора заданий с заданным ответом. Доверительная обстановка отсутствует. Бездушный и формализованный характер процедуры тестирования, оборачивается тем, что испытуемый лишается ощущения того, что психолог заинтересован в нем лично. Диалогические методы в этом плане имеют преимущества: общаясь с испытуемым, квалифицированный психолог может установить доверительный контакт, проявить персональное участие, создать атмосферу, снимающую напряжение.

С всеобщим распространением тестов, нарастает их критика. Дж. Равен,  указывает на этические и научные аспекты тестологии в сфере образования. Он называет безнравственным пренебрежение  ущербом, который практика тестирования наносит судьбам детей и интересам общества. Традиционные тесты достижений не могут должным образом оценить результаты педагогического  процесса, они не подходят для выявления одаренности учеников. Критика его справедлива. Тестология дает в  руки педагогам качественный измерительный  инструмент, явление нужное и прогрессивное.


Полагаем, что иногда тестологи обрушивают на ребенка тесты слишком трудные, сложные для его возраста. У него еще не сложились необходимые понятия и понятийные навыки, чтобы адекватно осмыслить общую инструкцию к тесту, и смысл отдельных вопросов. Присутствуют драматические казусы резкой недооценки умственного развития детей при применении вербальных тестов. Многие невербальные тесты требуют развития речевого мышления для осмысления того, что говорит взрослый в своей инструкции. Формализованный и бездушный характер процедуры тестирования, оборачивается тем, что испытуемый думает, что в нем лично не заинтересованы. Альтернатива взрослому тестированию в детской психологии это конечно игровой подход к тестированию.

2.2. Тестирование дошкольников

Образованию в нашей стране уделяется довольно серьезное внимание, как со стороны государства, так и со стороны родителей учеников и студентов.

Если раньше все первоклассники поступали в идентичные классы, то сегодня ситуация кардинально поменялась. Во многих городах нашей страны открываются школы, включающие в себя несколько типов классов, нацеленных на работу с детьми с разной подготовкой. Более развитые дети поступают в продвинутые классы с усиленным обучением, а обычные первоклашки – в простые классные группы. Причем эта тенденция коснулась и старых школ, в которых ведутся активные работы по внедрению новых программ.

Хорошо это или плохо, можно рассуждать бесконечно. Но ясно одно – каждый родитель хочет, чтобы его ребенок учился в самом продвинутом классе. Не так ли?

И чтобы ребенок успешно поступил в «элитный» класс, у него должна быть соответствующая дошкольная подготовка. То есть, он должен быть более развит, чем «обычные» дети. Понятное дело, что помочь могут специальные курсы и репетиторы. Но самая первоочередная задача – проверка подготовки ребенка.

Что же представляют собой тесты для дошкольников?

Это всевозможные тесты на проверку творческого мышления, математического склада ума, тяги к определенным областям знаний, логики и т.п. Естественно, все эти тесты должны быть красиво оформлены и содержать понятные ребенку слова и картинки. Для составления тестов, можно обратиться к детским психологам, которые хорошо разбираются в характере детей.

Федеральный государственный образовательный стандарт дошкольного образования разработан впервые в российской истории в соответствии с требованиями Закона «Об образовании в Российской Федерации». Прошлый год был отмечен активным общественным обсуждением стандарта дошкольного образования. 17 октября 2013 года он был утвержден приказом Министерства образования и науки Российской Федерации, а 14 ноября зарегистрирован Минюстом России. С 1 января 2014 года он вступил в силу.