ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.12.2023
Просмотров: 254
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
задания требуют переработки (замены неработающих дистракторов) или удаления их из теста [3].
5. График (кривая частотного распределения)
Для интерпретации распределения результатов выполнения теста необходимо построить гистограмму или график (кривую частотного распределения), в котором по оси Х откладывается количество выполненных заданий, по оси У – количество учащихся, верно выполнивших эти задания (в абсолютном значении или в процентах).
Схема 2
6. Анализ кривой частотного распределения
Асимметрия. Наличие асимметрии легко установить визуально, анализируя график или гистограмму.
Схема 3
Виды асимметрии
Положительная асимметрия распределения характерна для излишне легких тестов, эффект отрицательной асимметрии встречается в излишне трудных тестах. В хорошо сбалансированном по трудности тесте асимметрия нулевая.
Эксцесс.
С помощью эксцесса можно получить представление о том, является ли гистограмма островершинной или плоской. Островершинная кривая имеет явно выраженный положительный эксцесс, средневершинная имеет нулевой эксцесс, характерный для нормальной кривой, плосковершинная имеет эксцесс меньше нуля.
Схема 4
Виды эксцессов
Понятие «эксцесс» применимо лишь к унимодальным распределениям.
Для нормального распределения характерна кривая с нулевой симметрией, нулевым эксцессом, одной вершиной [5].
7. Меры центральной тенденции
Меры центральной тенденции предназначены для выявления «центрального положения», вокруг которого в основном группируется множество значений такого распределения данных.
Мода (Мо) – это такое значение, которое встречается наиболее часто среди результатов выполнения теста.
В том случае, если два значения встречаются одинаково часто, соответствующее распределение называется бимодальным. Один из наиболее важных выводов в случае бимодального распределения – корректировка трудности заданий теста.
5. График (кривая частотного распределения)
Для интерпретации распределения результатов выполнения теста необходимо построить гистограмму или график (кривую частотного распределения), в котором по оси Х откладывается количество выполненных заданий, по оси У – количество учащихся, верно выполнивших эти задания (в абсолютном значении или в процентах).
Схема 2
6. Анализ кривой частотного распределения
Асимметрия. Наличие асимметрии легко установить визуально, анализируя график или гистограмму.
Схема 3
Виды асимметрии
Положительная асимметрия распределения характерна для излишне легких тестов, эффект отрицательной асимметрии встречается в излишне трудных тестах. В хорошо сбалансированном по трудности тесте асимметрия нулевая.
Эксцесс.
С помощью эксцесса можно получить представление о том, является ли гистограмма островершинной или плоской. Островершинная кривая имеет явно выраженный положительный эксцесс, средневершинная имеет нулевой эксцесс, характерный для нормальной кривой, плосковершинная имеет эксцесс меньше нуля.
Схема 4
Виды эксцессов
Понятие «эксцесс» применимо лишь к унимодальным распределениям.
Для нормального распределения характерна кривая с нулевой симметрией, нулевым эксцессом, одной вершиной [5].
7. Меры центральной тенденции
Меры центральной тенденции предназначены для выявления «центрального положения», вокруг которого в основном группируется множество значений такого распределения данных.
Мода (Мо) – это такое значение, которое встречается наиболее часто среди результатов выполнения теста.
В том случае, если два значения встречаются одинаково часто, соответствующее распределение называется бимодальным. Один из наиболее важных выводов в случае бимодального распределения – корректировка трудности заданий теста.
В том случае, когда все значения баллов учеников встречаются одинаково часто, принято считать, что моды у распределения нет.
Среднее выборочное (М или ), или среднее арифметическое определяется суммированием всех значений совокупности и последующим делением на их число. Для совокупности индивидуальных баллов х
1
, х
2
, …, х
N
группы испытуемых числом N среднее значение будет равно:
Медиана (Ме) – среднее (центральное) значение упорядоченного числового ряда.
Например, для ряда 3, 4, 5, 6, 7, 9, 11 медианой будет 6, так как это значение имеет равное число значений справа и слева от себя в числовом ряду. Медиана чётного ряда находится как полусумма двух центральных значений.
Интерпретация мер центральной тенденции.
Меры центральной тенденции помогают при оценке качества теста в том случае, когда она проводится на репрезентативной выборке учеников. Хороший нормативно- ориентированный тест обеспечивает нормальное распределение индивидуальных баллов учеников, когда среднее значение баллов совпадает с модой и находится в центре распределения, около 68% концентрируются вокруг среднего по нормальному закону, а остальные сходят на нет к краям распределения:
Схема 5
График нормального распределения
Нормальное распределение унимодально и симметрично, мода, медиана и среднее значение равны.
На малых выборках любые показатели теряют свою стабильность.
Смещение среднего значения влево или вправо говорит о слишком трудной или слишком легкой подборке заданий теста [12].
8. Меры изменчивости
Размах – измеряет на шкале расстояние, в пределах которого изменяются все значения показателя в распределении. Из индивидуального балла самого сильного ученика вычитают индивидуальный балл самого слабого.
Дисперсия
Подсчет дисперсии основан на вычислении отклонений индивидуального балла каждого ученика от среднего арифметического в распределении: или x
i
– М (i=1,2,…,N). Знак отклонения указывает место результата ученика по отношению к среднему арифметическому по тесту. Для ученика с индивидуальным баллом выше среднего значение разности будет положительно, а для тех, у кого результат ниже среднего арифметического, отклонение отрицательно.
Мера изменчивости, называемая дисперсией обозначается S
2
x
(или ?
2
x
) и вычисляется по формуле
, где x
1
– индивидуальный балл первого ученика, x
2
– индивидуальный балл второго ученика и т. п., – среднее выборочное (среднее арифметическое) для данной группы, ? – сумма квадратов разностей, вычисленных для каждого ученика, N – количество учащихся в данной группе.
Низкая дисперсия индивидуальных баллов говорит о слабой дифференциации испытуемых по уровню подготовленности в группе, что противоречит основной цели нормативно-ориентированных тестов.
9. Определение достоверности различий между сравниваемыми группами
Существуют множество статистических критериев и способов для определения того, является ли различие в уровне знаний, умений, качеств двух групп случайных или
статистически достоверным. Один из таких способов – расчёт t-критерия Стьюдента (для независимых выборок) по формуле
, где и
– среднее выборочное (среднее арифметическое) для первой и второй группы, ?
2
1
и
?
2
2
– дисперсия для данной группы, n
1 и n
2
– количество учащихся в данной группе.
Полученный результат сравнивается с табличным результатом для данной степени свободы ?, которое определяется по формуле:
? = n
1
+n
2
-2, где n
1
– количество учащихся в первой группе, n
2
– количество учащихся во второй группе. Например, для двух групп численностью каждая 10 человек ? = 10 = 10 – 2 = 18, t
табл
= 2,10.
В том случае, если результат превосходит табличное значение, можно говорить о достоверном статистическом различии в уровне знаний, формирований умений или личностных качеств между первой и второй группой.
Таблица 9
Критические значения t-критерия Стьюдента при уровне значимости 0,05
?
t-критерий
4 2,78 5
2,58 6
2,45 7
2,37 8
2,31 9
2,26 10 2,23 11 2,20 12 2,18 13 2,16 14 2,14 15 2,13 16 2,12 17 2,11 18 2,10 19 2,09 20 2,09 25 2,06 30 2,04 40 2,02 50 2,01 60 2,00 80 1,99 100 1,98
, где и
– среднее выборочное (среднее арифметическое) для первой и второй группы, ?
2
1
и
?
2
2
– дисперсия для данной группы, n
1 и n
2
– количество учащихся в данной группе.
Полученный результат сравнивается с табличным результатом для данной степени свободы ?, которое определяется по формуле:
? = n
1
+n
2
-2, где n
1
– количество учащихся в первой группе, n
2
– количество учащихся во второй группе. Например, для двух групп численностью каждая 10 человек ? = 10 = 10 – 2 = 18, t
табл
= 2,10.
В том случае, если результат превосходит табличное значение, можно говорить о достоверном статистическом различии в уровне знаний, формирований умений или личностных качеств между первой и второй группой.
Таблица 9
Критические значения t-критерия Стьюдента при уровне значимости 0,05
?
t-критерий
4 2,78 5
2,58 6
2,45 7
2,37 8
2,31 9
2,26 10 2,23 11 2,20 12 2,18 13 2,16 14 2,14 15 2,13 16 2,12 17 2,11 18 2,10 19 2,09 20 2,09 25 2,06 30 2,04 40 2,02 50 2,01 60 2,00 80 1,99 100 1,98
1 2 3 4 5 6 7
Тема 11
ЕДИНЫЙ ГОСУДАРСТВЕННЫЙ ЭКЗАМЕН
С 2001 года в нашей стране проводится эксперимент по введению единого государственного экзамена (ЕГЭ) для выпускников школ и поступающих в высшие учебные заведения.
Причины введения ЕГЭ
В результате реформ конца 80-90-х годов российское образование перестало носить унифицированный характер и перешло к использованию вариативных программ, учебников и пособий, что, с одной стороны, увеличило возможности системы образования: реализация идей развивающего обучения, профессиональной ориентации, возможности индивидуального подхода, но, с другой стороны, усложнило контроль за качеством получаемого образования. «В условиях резко возросшего разнообразия средств, методов и содержания обучения школьников со всей остротой встала задача обеспечения единого уровня и содержания базового ядра общего и среднего образования для всех выпускников школ» [7]. ЕГЭ может стать эффективным надежным и объективным средством контроля за качеством знаний и умений учащихся, в случае успешного завершения эксперимента. Таким образом, в данный момент ЕГЭ рассматривается как одно из средств модернизации современного образования в России.
Задачи единого экзамена:
расширение доступности высшего образования благодаря введению однотипных экзаменов для всех выпускников общеобразовательных школ и их параллельного участия в заочном конкурсном отборе сразу в несколько вузов;
совершенствование системы и практики финансирования высших учебных заведений на основе рыночной состязательности между ними за прием лучших студентов;
снижение психологической нагрузки на выпускников общеобразовательных учреждений за счет упразднения вступительных экзаменов в вузы;
объективизация и унификация требований к общеобразовательной подготовке поступающих в вузы;
стимулирование деятельности педагогических коллективов общеобразовательных учреждений по улучшению качества учебного процесса за счет объективной и независимой сравнительной оценки результатов общеобразовательной подготовки выпускников школ.
Преимущества ЕГЭ перед другими формами контроля
1. Объективность.
Использование ЕГЭ в качестве выпускного экзамена в средней школе и его результатов для поступления в высшие учебные заведения имеет ряд преимуществ перед традиционными устными и письменными экзаменами. Прежде всего, это объективность оценивания. В системе ЕГЭ отсутствует преподаватель, который проверяет знания выпускника, то есть исключается субъективный момент (неприязнь к учащемуся, заинтересованность в хороших показателях, плохое настроение, самочувствие преподавателя и др.) при выставлении оценки. Благодаря стандартизации - единой форме предъявления контрольно-измерительных материалов (КИМ) и единого метода обработки полученных результатов достигается высокий уровень объективности оценивания учебных достижений выпускников.
2. Надежность.
Разработка тестов и анализ результатов тестирования в соответствии с принципами классической или современной теорий тестов позволяют обеспечить точность и надежность оценивания уровня учебных достижений. Чтобы это преимущество ЕГЭ могло быть реализовано, КИМы должны включать тестовые задания, которые прошли экспертную оценку и были апробированы на репрезентативной выборке испытуемых.
3. Достоверность.
Тестовые технологии могут обеспечить достоверные результаты, свободные от фальсификации и искажения. Нельзя не согласиться, что без обеспечения высокой
достоверности единого экзамена, без гарантий его информационной безопасности невозможно завоевать доверие к результатам ЕГЭ, что, безусловно, резко снизит эффективность этого нововведения.
Выделяют ряд возможностей, которые могут способствовать снижению достоверности.
Это рассекречивание, подставка, подсказка, подтасовка.
Чтобы не произошло рассекречивания КИМов, существует система информационной безопасности, которая защищает тестовые материалы от преждевременного доступа.
Один из возможных способов защиты - это создание большого банка калиброванных тестовых заданий и обеспечение свободного доступа к этому банку (например, через интернет или печатные издания). Знакомство учащихся с множеством заданий банка позволит им лучше подготовиться к сдаче теста. Для самого экзамена формируются многочисленные варианты теста в компьютерном режиме из существующего банка заданий (калиброванных) индивидуально для каждого испытуемого.
Структура КИМов ЕГЭ
«КИМы - это стандартизированная экзаменационная работа, создаваемая в соответствии с требованиями теории педагогических измерений, позволяющая с достаточной объективностью и надежностью провести независимую государственную аттестацию выпускников общеобразовательных учреждений и отбор абитуриентов вузов» [3.].
При составлении КИМов определялось эффективное соотношение использования различных форм заданий в тесте для итоговой аттестации выпускников. При этом учитывался многолетний опыт зарубежных коллег. В США сформировалась традиция применения тестов, состоящих из заданий закрытого типа, то есть заданий с выбором правильного ответа (так устроен, например, самый популярный тест академических способностей SAT). Но задания этого типа не могут оценивать способности учащегося рассуждать и анализировать, делать самостоятельные выводы, создавать письменный текст, высказывать собственное мнение и т. д. Включение в КИМы заданий только закрытого типа было бы недостаточным, так как снижало бы возможности контроля знаний выпускников. Для тестологической практики Великобритании характерно использование как закрытых, так и открытых заданий. Так, в тестах на получение общего сертификата о среднем образовании (general certificate of secondary education - GCSE), которые разрабатываются Кембриджским экзаменационным синдикатом, доля открытых заданий выше, чем доля заданий с выбором правильного ответа.
Чтобы обеспечить эффективный контроль знаний и умений выпускников отечественной школы, было решено включить в КИМы различные формы заданий: задания с выбором правильного ответа, задания на дополнение и задания со свободным развернутым ответом
(ответ в виде эссе, рецензии, анализа текста).
КИМы по различным предметам включают три части - А, В, С. Каждая часть состоит из заданий, сгруппированных по форме. Общее количество заданий колеблется от 25 до 70.
Часть А предлагает задания с выбором ответа (задания закрытого типа). Эти задания достаточно легкие и направлены на проверку знаний фактического материала, правил, формул, определений и др. Доля таких заданий в зависимости от предмета колеблется.
Они могут преобладать в количественном отношении над другими видами заданий, но весовой коэффициент таких заданий меньше, то есть в суммарном взвешенном балле за решение одного задания типа А дается меньше очков, чем за решение заданий другого типа.
Часть В состоит из заданий открытого типа - из заданий на дополнение в виде числа или одного слова. В этих заданиях испытуемый сам конструирует правильный ответ, в отличие от заданий закрытого типа, где ответ уже дан и надо только определить правильный. Как правило эти задания сложнее, чем задания части А, поэтому их весовой коэффициент выше.
Выделяют ряд возможностей, которые могут способствовать снижению достоверности.
Это рассекречивание, подставка, подсказка, подтасовка.
Чтобы не произошло рассекречивания КИМов, существует система информационной безопасности, которая защищает тестовые материалы от преждевременного доступа.
Один из возможных способов защиты - это создание большого банка калиброванных тестовых заданий и обеспечение свободного доступа к этому банку (например, через интернет или печатные издания). Знакомство учащихся с множеством заданий банка позволит им лучше подготовиться к сдаче теста. Для самого экзамена формируются многочисленные варианты теста в компьютерном режиме из существующего банка заданий (калиброванных) индивидуально для каждого испытуемого.
Структура КИМов ЕГЭ
«КИМы - это стандартизированная экзаменационная работа, создаваемая в соответствии с требованиями теории педагогических измерений, позволяющая с достаточной объективностью и надежностью провести независимую государственную аттестацию выпускников общеобразовательных учреждений и отбор абитуриентов вузов» [3.].
При составлении КИМов определялось эффективное соотношение использования различных форм заданий в тесте для итоговой аттестации выпускников. При этом учитывался многолетний опыт зарубежных коллег. В США сформировалась традиция применения тестов, состоящих из заданий закрытого типа, то есть заданий с выбором правильного ответа (так устроен, например, самый популярный тест академических способностей SAT). Но задания этого типа не могут оценивать способности учащегося рассуждать и анализировать, делать самостоятельные выводы, создавать письменный текст, высказывать собственное мнение и т. д. Включение в КИМы заданий только закрытого типа было бы недостаточным, так как снижало бы возможности контроля знаний выпускников. Для тестологической практики Великобритании характерно использование как закрытых, так и открытых заданий. Так, в тестах на получение общего сертификата о среднем образовании (general certificate of secondary education - GCSE), которые разрабатываются Кембриджским экзаменационным синдикатом, доля открытых заданий выше, чем доля заданий с выбором правильного ответа.
Чтобы обеспечить эффективный контроль знаний и умений выпускников отечественной школы, было решено включить в КИМы различные формы заданий: задания с выбором правильного ответа, задания на дополнение и задания со свободным развернутым ответом
(ответ в виде эссе, рецензии, анализа текста).
КИМы по различным предметам включают три части - А, В, С. Каждая часть состоит из заданий, сгруппированных по форме. Общее количество заданий колеблется от 25 до 70.
Часть А предлагает задания с выбором ответа (задания закрытого типа). Эти задания достаточно легкие и направлены на проверку знаний фактического материала, правил, формул, определений и др. Доля таких заданий в зависимости от предмета колеблется.
Они могут преобладать в количественном отношении над другими видами заданий, но весовой коэффициент таких заданий меньше, то есть в суммарном взвешенном балле за решение одного задания типа А дается меньше очков, чем за решение заданий другого типа.
Часть В состоит из заданий открытого типа - из заданий на дополнение в виде числа или одного слова. В этих заданиях испытуемый сам конструирует правильный ответ, в отличие от заданий закрытого типа, где ответ уже дан и надо только определить правильный. Как правило эти задания сложнее, чем задания части А, поэтому их весовой коэффициент выше.
Задания частей А и В сконструированы таким образом, чтобы проверка проходила в компьютерном режиме.
В части С дается задание, которое предполагает свободный развернутый ответ. Это может быть полное решение математической задачи или написание текста. Задания части С проверяют умения выпускников размышлять, рассуждать на заданную тему, формулировать и грамотно выражать свои мысли письменно. Эта часть теста проверяется независимыми экспертами. Это требует дополнительных материальных расходов и в какой-то степени дает возможность повлиять на выставление баллов по части С, но, тем не менее, включение этой части в КИМ увеличивает возможность проверки широкого спектра знаний и умений выпускников [3].
КОНТРОЛЬНЫЙ ТЕСТ ПО КУРСУ
«СОВРЕМЕННЫЕ СРЕДСТВА ОЦЕНИВАНИЯ
РЕЗУЛЬТАТОВ ОБУЧЕНИЯ»
I. Мониторинг качества образования – это …
1. механизм контроля и слежения за качеством
2. совокупность условий и средств, обеспечивающих непрерывное наблюдение за процессом обучения
3. система органов, контролирующих качество образования
4. обязательный этап аккредитации ОУ
II. Личностно-ориентированный подход рассматривает образование как …
1. ориентацию на проблемы личности
2. способ решения поставленных человеком профессиональных задач
3. способ развития личности
4. деятельность по согласованию интересов личности и общества.
5. предпосылку социализации
III. Права на выдачу документа об образовании государственного образца дает образовательному учреждению …
1. лицензирование
2. аттестация
3. аккредитация
4. модернизация качества образования
5. соответствие государственному образовательному стандарту
IV. В системе опережающего обучения, по сравнению с системой поддерживающего обучения, роль традиционных знаний …
1. возрастает
2. снижается
3. остается прежней
4. изменяется в зависимости от специфики обучения
V. Критериями качества знания в современных педагогических технологиях выступают …
1. знания, умения, навыки
2. развитие творческих способностей
3. опыт эмоционально-ценностных отношений
4. способности к самореализации в трудовой или учебной деятельности
VI. Мониторинг качества образования контролирует…
1. выполнение образовательным учреждением требований государственного стандарта