Файл: Метод тестирования в психологии и педагогике: надежность, валидность, стандартизация (Виды тестирования и их особенности).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 19.06.2023

Просмотров: 745

Скачиваний: 14

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Сложные и простые тесты различаются тем, что последние состоят из нескольких самостоятельных подтестов. По каждому тесту должен быть получен ответ, при этом высчитывается общая оценка. В случае соединения нескольких единичных тестов образуется пакет тестов.

Полагаем, что развитие тестирования сопровождалось невозможными ожиданиями и неправильным применением некоторых тестов. Пользователям обязательно нужно знать, как оценить тест: необходимо обладать определенной базой знаний о тестах. В психологии тестами называют стандартизированные методики психодиагностики, которые позволяют получать сопоставимые количественные и степени развитости изучаемых свойств качественных показателей.

Особенностью проективных методик является относительно неструктурированная задача для испытуемого. Тестовые стимулы обычно неоднозначны и расплывчаты. Существуют общие признаки для проективных методик: неопределённость, неоднозначность используемых стимулов, отсутствие ограничений в выборе ответа, отсутствие оценки ответов испытуемых. Проективные тесты могут быть бланковыми опросными и рисуночными.

Проективные тесты, по мнению Л. Франка – это такой приём исследования личности, при котором испытуемого помещают в ситуацию, реакцию на которую он осуществляет в зависимости от значения для него этой ситуации, от его мыслей и чувств. Проективные техники основаны на том, что недостаточно структурированный материал, выступающий в качестве стимула, при соответствующей организации всего эксперимента в целом порождает процессы фантазии, воображения, в которых раскрываются те или иные характеристики субъекта [7, с. 23].

Полагаем, чтобы тест был достаточно надёжным средством исследования и позволял получать вполне достоверные результаты. Результатам можно доверять и на их основе можно делать правильные практические выводы, чтобы используемый тест отвечал определённым требованиям. Поэтому прежде чем давать разрешение на широкое использование психологического теста, необходимо провести тщательную объективную проверку соответствия его определённым нормам и требованиям. Конечно, на практике оценка и места испытуемых в результате повторного тестирования часто меняются. Метод повторного тестирования является основным при определении недежности теста. Факторов, влияющих на надёжность тестирования, достаточно много и обеспечивать постоянство их всех практически невозможно, но они гораздо меньше влияют на достоверность получаемых результатов.


В прошлом столетии появились первые стандартизованные тесты по измерению результатов школьного обучения. Стандартизированный педагогический тест составлен психологом Э. Торнодайком. После работы Э. Торндайка в этих тестах стали использоваться принципы измерения, разработанные в психологических лабораториях. В качестве примера таких тестов можно назвать шкалы оценки качества почерка и письменных сочинений, а также тесты на правописание, арифметический счет и рассуждения. После выхода в 1923 году первого издания станфордского теста достижений, появились батареи достижений. Эти батареи позволяли осуществлять сравнимые измерения выполнения заданий по разным школьным предметам, оцениваемые относительно единой системы нормативов.

В советской психологии Роршаха тест использовался преимущественно в клинико – психологических исследованиях личности (Л.Ф. Бурлачук, 1979; И. Г. Беспалько, 1983). Велась значительная работа по стандартизации теста (Б. И. Белый, 1982; И. Г. Беспалько, 1983), которая позднее не получила дальнейшего развития. В работах советских психологов результаты, получаемые с помощью Роршаха теста, анализировались не только на личностном уровне, но и на уровне элементарном перцептивном. По настоящее время сфера использования теста весьма узка, профессиональная работа с Роршаха тестом все еще остается уделом незначительного числа специалистов-психологов [12, с. 56].

Социометрия – это социально-психологический тест, направленный на выявление взаимоотношений внутри группы людей: каковы симпатии внутри группы, кто является всеобщим любимчиком, а кого обходят стороной [19, с. 45].

Методику социометрии широко применяют для школьников как в начальных, так и в старших классах. Этот метод основан на воображаемом выборе, который делают все члены группы. Предлагается достаточно напряженная эмоциональная ситуация, в рамках которой участникам необходимо сделать выбор на бумаге в пользу или против некоторых членов группы. Стоит отметить, что у школьников нет как таковой совместной деятельности – чаще всего они просто учатся вместе, сидя друг с другом за партой. Поэтому им тяжело будет выбирать в своей группе лидера. Однако оценить эмоциональную атмосферу класса при помощи социометрии возможно.

Как провести тест по социометрии?

Теперь возникает вопрос - какую теоретическую ситуацию предложить школьникам, чтобы оценить их эмоциональные взаимоотношения? Ситуация должна быть связана со школьной жизнью, однако можно добавить и внеурочную совместную деятельность. Для младших школьников при проведении социометрии можно использовать следующие вопросы:


С кем бы ты хотел делать домашние задания, выполнять готовиться к экзаменам и сдаче тестов?

Кого бы ты пригласил на свой день рождения?

Кто больше всех тебе нравится в классе?

С кем бы ты хотел жить по соседству?

Кого бы ты выбрал для поездки или похода на природу?

Проведение социометрии в любом классе является серьезным эмоциональным испытанием. Особенно для тех, кто не особо популярен в классе. Необходимо честно написать, кто тебе нравится, а кто нет, подписав при этом свою анкету. Лучше, если проводить методику будет опытный психолог, знакомый с классом и обстановкой в нем, ведь наверняка он уже завоевал доверие и расположение к себе школьников.

Перед началом опроса необходимо провести предварительный инструктаж. Вот один из вариантов:

«Мы часто общались с вами, пытались определить, дружный ли у вас класс, и если нет, то по какой причине. Я хочу глубже разобраться в этом. Сейчас вы получите бланки и прочтете их. Вопросы и сложные и простые одновременно – они касаются отношений между вами. Отнеситесь серьезно! Конечно, вы можете не отвечать, но так мне будет сложнее помогать вам создавать дружескую атмосферу в классе! Не забудьте подписать свои анкеты – иначе потеряется весь смысл. Я гарантирую - ваши ответы буду знать только я, они никому не попадут в руки. Ни с кем не советуйтесь, не подсматривайте ответы соседа. Мне важна личная точка зрения каждого».

При ответах на вопросы возможны варианты выбора:

количество ограничено 3-5;

разрешается полная свобода при выборе;

отвечающий расставляет всех участников по значимости.

После обработки данных составляется таблица с полученными результатами. Вертикаль будет состоять из фамилий участников группы, горизонталь – из номеров, под которыми испытуемые находятся в списке. Плюсами можно проставить, кто кого выбирает. После составляется схема наподобие мишени - социограмма, дающая наглядное представление о полученных результатах.

внутренний круг — «зона звезд», в нее попадают лидеры с максимальным количеством выборов;

второй круг — зона предпочитаемых. Они набрали половину или больше выборов;

третий круг — зона пренебрегаемых, оттесненных – они получили меньше половины голосов;

четвертый круг — зона изолированных – не получивших ни одного очка.

Чтобы грамотно разобраться в популярности одних и непопулярности других - социометрию необходимо проводить несколько в год, что позволит определить эффективность проводимой психологом и классным руководителем работы и подкорректировать ее в дальнейшем [19, с.45].


Стандартизация теста заключается в приведении процедуры оценок к общепринятым нормативам. Стандартизация предполагает преобразование нормальной или искусственно нормализованной шкалы первичных оценок в шкальные оценки. Тестовые нормы, полученные в ходе стандартизации, представляют собой систему шкал с характеристиками распределения тестового балла для различных выборок. Они не являются «внутренними» свойствами теста, а лишь облегчают его практическое применение [16, с. 45].

Полагаем, что основным элементом всех методов является так называемый критерий валидности это независимый от теста, внешний по отношению к тесту источник информации об измеряемом психическом свойстве. Мы не можем судить о валидности теста, и сравним его результаты с источником истинной валидной информации об измеряемом свойстве. В качестве критерия валидности используется экспертная оценка.

Надежность – один из критериев качества теста, обеспечивающий точность измерений, а также устойчивость результатов теста к действию посторонних случайных факторов [14, с. 33].

Надежность теста тем выше, чем более согласованы результаты одного и того же человека при повторной проверке знаний посредством того же теста или эквивалентной его формы (параллельного теста).

Валидность – способность теста получать результаты, соответствующие поставленной цели. Валидность теста показывает, насколько хорошо тест делает то, для чего он был создан [14, с. 33].

Для оценки надежности тестов используются следующие методы:

– ретестовый метод;

– метод параллельных форм;

– метод расщепления теста [14, с. 33].

Оценка надежности строится на подсчете корреляции между двумя наборами результатов выполнения одного и того же теста или двух его параллельных форм. Чем выше корреляция, тем надежнее тест. Хорошим коэффициентом надежности теста считается тот, когда показатель колеблется в пределах 0,8 < r < 1.

Ретестовый метод оценки надежности предполагает двукратное использование одного и того же теста в одной группе испытуемых. Он основан на подсчете корреляции индивидуальных баллов испытуемых по результатам выполнения первого и второго тестирования. Данный метод не очень удобен, так как временной фактор играет большую роль: временной промежуток не может быть большим – изменится уровень учебных достижений, но и не должен быть слишком коротким – испытуемые могут помнить задания теста и ответы на них. Метод параллельных форм предполагает двукратное тестирование одной и той же группы испытуемых тестами, которые идентичны по содержанию, структуре, включают задания, равные по трудности, дифференцирующей способности, т. е. параллельными формами теста. Главная трудность применения этого метода в том, что разработчику надо создать новый тест, тождественный первому, и доказать идентичность, а это очень трудоемкая процедура.


Метод расщепления теста удобен в практическом применении, так как ограничивается однократным тестированием. Валидность проверяется сравнением результатов тестирования испытуемого с экспертными – независимыми от этих результатов оценками уровня усвоения им материала другими методами: устным опросом, традиционной контрольной работой, экзаменом или сопоставлением этих результатов с оценками текущей успеваемости [12, с. 22].

Для итогового контроля 30 учащихся был разработан тест, содержащий 22 тестовых задания. Математико-статистическая обработка результатов тестирования осуществлялась с помощью пакета MS EXCEL, применялась дихотомическая шкала оценивания. По результатам тестирования была сформирована матрица размерностью 30×22, состоящая из 0 (неверный ответ) и 1 (верный ответ). Далее для расчета надежности теста потребовались следующие действия:

1) подсчитать индивидуальные баллы испытуемых (сумма баллов по строкам) Xi;

2) найти количество правильных ответов на каждое задание (сумма баллов по столбцам) Rj;

3) сначала упорядочить строки матрицы по убыванию величины Xi, затем столбцы – по убыванию величины Rj;

4) подсчитать количество неправильных ответов на каждое задание Wj ( qj =1− pj ); долю правильных ответов pj и долю неправильных ответов на каждое задание qj;

5) рассчитать коэффициент надежности по формуле (2).

Фрагмент матрицы представлен в табл. 1.

Таблица 1

Результаты тестирования

Порядковый номер студента

Ответы на вопросы

Xi

1

2

3

4

5

1

1

1

1

1

1

5

2

1

1

1

1

0

4

3

1

0

0

1

1

3

4

1

1

0

0

0

2

5

0

1

1

0

0

2

6

1

0

0

0

0

1

Rj

5

4

3

3

2

Wj

1

2

3

3

4

pj

0,833

0,667

0,5

0,5

0,333

qj

0,167

0,333

0,5

0,5

0,667