Файл: Самылкина Н.Н.( Современные средства оценивания результатов обучения. Педагогика).pdf
Добавлен: 25.10.2018
Просмотров: 2518
Скачиваний: 114
Ø
Основы теории педагогических измерений
Ø
Переменные измерения и их взаимосвязь
Ø
Систематические и случайные ошибки измерений,
истинный балл
Ø
Доверительный интервал
Ø
Точечные и доверительные оценки
Начиная разговор о педагогических измерениях в образова-
нии, необходимо познакомиться с некоторыми понятиями, ко-
торые будут использоваться в дальнейшем.
Контроль — важнейший компонент практической деятель-
ности педагога, позволяющий выявить достоинства и недостат-
ки новых методов обучения, установить взаимосвязи между
планируемыми, реализуемыми и достигнутыми уровнями обра-
зования, оценить достижения ученика, выявить пробелы в его
знаниях и умениях, определить эффективность работы педаго-
гического коллектива в целом (для принятия управленческих
решений) и многое другое. С другой стороны, контроль — это
объект теоретических исследований, в настоящее время тесно
связанный с изменениями подходов к определению и оценке ка-
чества образования.
Понятие «педагогический контроль» можно рассматривать
как единую дидактическую и методическую систему провероч-
ной деятельности. Применительно к повседневному учебному
процессу, проверочная деятельность направлена на выявление
и оценку результатов учебной деятельности школьников или
студентов. В действительности, несмотря на существующие об-
щие критерии выставления, оценка остается субъективным ме-
рилом учебных достижений.
Возникает проблема объективного измерения результатов
учебной деятельности: «Измерение предполагает проведение
объективного
количественного
сопоставления
оцениваемого
свойства ученика с некоторым эталоном, принятым в качестве
единицы измерения. При педагогическом измерении роль оце-
ВВЕДЕНИЕ В ПРОБЛЕМУ
ПЕДАГОГИЧЕСКИХ ИЗМЕРЕНИЙ
2794633475-11
ниваемого свойства отводится знаниям, умениям и навыкам уче-
ника, так традиционно сложилось в отечественной практике, — а
вместо единицы измерения используются контрольные задания
или части заданий по проверяемому содержанию предмета» [20].
Существует и общее определение: «Измерение — процесс со-
поставления оцениваемых характеристик объекта на числовую
ось» [13] — настолько общее, что оно не отражает процедуру из-
мерения и характеристики используемой шкалы. «Измерение —
оценка (как процедура), проводимая с использованием понятия
шкалы вполне определенных способностей для количественной
оценки поведения или характеристики, например, математиче-
ских способностей» — таково современное понимание измере-
ния
в международном сообществе специалистов [5].
Итак, проблема педагогических измерений ставит перед нами
три вопроса:
l
Для чего измерять?
l
Что измерять?
l
Чем измерять?
Проще всего ответить на первый вопрос, связанный с поста-
новкой целей контроля
. Для определения степени владения ба-
зовыми знаниями, умениями и навыками, необходимыми для
начала обучения, служит входной контроль. Для выявления
пробелов в знаниях в процессе изучения нового материала пред-
назначен текущий, или тематический, контроль. Для оценки
качества знаний после прохождения всего предметного курса
или итоговой аттестации выпускников основной или средней
(полной) школы служит итоговый контроль.
Второй же и третий вопросы взаимосвязаны и более сложны.
В педагогическом контроле нет выделенного объекта измере-
ния, нет точки отсчета («абсолютного нуля»), нет единиц изме-
рения. Все это создает определенные трудности, которые специ-
алисты пытаются решать, опираясь на математическую тео-
рию измерений
.
Понятие «измерения» специалистами трактуется следую-
щим образом. Измерения — это конструирование числовой
функции, осуществляющей изоморфное отображение эмпири-
ческой структуры в некую числовую шкалу, где изоморфизм
определяет условия взаимно-однозначных соответствий при
отображении. Отсюда главная задача измерения: поиск такой
числовой структуры, которая будет изоморфна эмпирическим
референтам (измеряемым характеристикам) [20].
6
Современные средства оценивания результатов обучения
2794633475-11
Для педагогических измерений необходимо определить сле-
дующие параметры: объект измерения (переменные измере-
ния
), измерительная процедура, средства измерения и шкала.
Главная проблема при этом — выделить переменные изме-
рения, которые в педагогике не носят явного характера. Такие
переменные называют латентными (неявными), т. е. скрыты-
ми от возможности непосредственного измерения. Такая пере-
менная может быть выражена в виде совокупности заданий и
проявляться только в эмпирических результатах выполнения
теста, путем анализа; точность такого измерения, разумеется,
ниже, чем в точных науках. В качестве переменной измерения
могут выступать дискретные и непрерывные характеристики:
из них дискретные не имеют промежуточных значений между
двумя точками, тогда как непрерывные могут принимать лю-
бые значения на всем заданном интервале.
При измерениях используют следующие обозначения (рис. 1).
На некоторой числовой оси выделяют интервал, называемый до-
верительным
, в котором находятся наблюдаемый балл (Х) и ис-
тинный балл (Т).
Доверительным интервалом специалисты называют такие
пределы выборочного распределения, в которых можно с зара-
нее определенной вероятностью ожидать нахождения значения
генеральной совокупности
(т. е. результатов работы всех воз-
можных тестируемых).
Следовательно, все точки, лежащие в доверительном интер-
вале, можно считать доверительными оценками.
Интервальное исследование — это получение некоторого
интервала вокруг наблюдаемого балла (Х), границы которого
определяются ошибкой измерения и внутри которого лежит ис-
тинный балл (Т). Постепенно сужая интервал, мы приближаем-
ся к истинному баллу. Математические способы позволяют от Х
Введение в проблему педагогических измерений
7
Рис. 1
2794633475-11
максимально близко подойти к Т, но в классической и совре-
менной теории тестирования это реализуется по-разному.
Процедура измерения — совокупность операций, позволяю-
щая перейти от эмпирических референтов (заданий) к число-
вым оценкам измеряемых характеристик.
Измерительный инструмент состоит из двух компонентов:
теста
и шкалы для фиксации результатов измерения. Педаго-
гический тест — это инструмент, состоящий из квалиметриче-
ски (с использованием различных методов определения качест-
ва) выверенной системы тестовых заданий, стандартизованной
процедуры проведения и заранее спроектированной технологии
обработки и анализа результатов, предназначенный для измере-
ния качеств и свойств личности, измерение которых возможно в
процессе систематического обучения [9].
Оставим пока понятие «педагогический тест» для отдельного
обсуждения и рассмотрим понятие шкалы.
«Шкала — числовая система, в которой отношения между
различными свойствами изучаемых явлений, процессов переве-
дены в свойства того или иного множества, как правило — мно-
жества чисел» [13].
Существуют шкалы отношений, интервальные шкалы, по-
рядковые (ранговые) и номинальные (шкалы наименований).
Здесь шкалы были перечислены в порядке убывания их мощ-
ности;
в тестологии же, описывая использование тех или иных
шкал, говорят об «уровнях измерений»:
1. Шкала наименований представляет собой номинальный
уровень
, не связана с понятием «величина» (т. е. является
неметрической) и используется для того, чтобы отличать
один объект от другого (фамилии учеников, номера теле-
фонов и пр.). Над элементами такой шкалы не допускается
никаких арифметических действий, — возможен лишь под-
счет количества объектов с совпадающими признаками.
Для школьной практики это означает возможность подсче-
та количества отличников, «хорошистов» или двоечников
и сравнение этих групп по количеству учащихся.
2. Порядковая шкала (ранговая, шкала упорядоченной
классификации) представляет собой ординальный уро-
вень
, когда объекты измерения разбиваются на группы,
соответствующие определенной точке шкалы. Такая шка-
ла только упорядочивает объекты, приписывая им те или
8
Современные средства оценивания результатов обучения
2794633475-11
иные ранги. Относительно же значений этой шкалы нель-
зя говорить ни о том, во сколько раз измеряемая величина
больше или меньше другой, ни о том, на сколько она мень-
ше или больше; не допускается никаких арифметических
действий со значениями, — допустима лишь замена чисел,
характеризующих величину того или иного признака, дру-
гими, не нарушающими ранговый порядок объектов.
Для корректного использования этой шкалы в школе так-
же следует помнить, что с ее помощью можно подсчитать
лишь количество учащихся, получивших различные оцен-
ки. Сравнивать же качество их подготовки путем вычисле-
ния среднего балла недопустимо!
3. Интервальная шкала (интервальный уровень измерения)
основана на сравнении различий между объектами по вели-
чинам измеряемых признаков или свойств и характеризует-
ся тем, что не имеет естественного начала отсчета и единиц
измерения. Начало отсчета и интервалы здесь выбираются
по договоренности относительно выбранного параметра, т. е.
шкалу можно растягивать и сжимать. Интервальная шкала
позволяет рассчитать среднее арифметическое и среднее
квадратичное отклонение и коэффициенты корреляции.
Современная теория тестов позволяет преобразовать резуль-
таты тестирования в интервальную шкалу.
Для школьной практики это новый формат оценивания,
который может прижиться при активном внедрении тесто-
вых форм контроля качества подготовки выпускников.
4. Шкала отношений — самая мощная шкала. Она позволя-
ет оценивать, во сколько раз один измеряемый объект боль-
ше (меньше) другого объекта, принимаемого за эталон.
Шкала отношений имеет естественное начало отсчета, но в
ней нет естественной единицы измерений. Шкалами отно-
шений измеряют почти все физические величины, но ею
нельзя пользоваться в социальных измерениях.
Говоря о качестве педагогических измерений, прежде всего
подразумевают их объективность. Существует несколько гра-
даций объективности.
Процедурная объективность отождествляется с объектив-
ностью процедуры тестирования (отсутствует педагог, одинако-
вые условия для всех, единые критерии проверки и пр.).
Классическая объективность описывается формулой:
Х
(наблюдаемый балл)
= Т
(истинный балл)
+ Е
(ошибка измерения)
.
Введение в проблему педагогических измерений
9
2794633475-11