ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3686
Скачиваний: 4
267
Непараметрические критерии
Одновыборочный критерий Колмогорова-Смирнова
Процедура Одновыборочный критерий Колмогорова
-
Смирнова сравнивает эмпирическую
функцию распределения переменной с заданным теоретическим распределением
,
которое может быть нормальным
,
равномерным
,
пуассоновским или экспоненциальным
.
Статистика
Z
Колмогорова
-
Смирнова вычисляется как максимум модуля разности между
эмпирической и теоретической функциями распределения
.
Эта статистика критерия
согласия используется для проверки гипотезы о том
,
что наблюдения взяты из указанного
распределения
.
Пример.
Многие параметрические критерии требуют
,
чтобы переменные были
распределены нормально
.
Одновыборочный критерий Колмогорова
-
Смирнова можно
использовать для проверки гипотезы о том
,
что переменная
(
например
,
доход
)
имеет
нормальное распределение
.
Статистики.
Среднее значение
,
стандартное отклонение
,
минимум
,
максимум
,
количество
непропущенных наблюдений и квартили
.
Данные.
Используйте количественные переменные
(
измеренные в интервальной шкале
или шкале отношений
).
Предположения.
При использовании критерия Колмогорова
-
Смирнова предполагается
,
что параметры проверяемого распределения заданы заранее
.
В данной процедуре эти
параметры оцениваются по выборке
.
Выборочные среднее значение и стандартное
отклонение используются в качестве параметров для нормального распределения
,
выборочные минимум и максимум задают размах равномерного распределения
,
наконец
,
выборочное среднее используется как параметр для пуассоновского и экспоненциального
распределений
.
Способность критерия определить отклонение от предполагаемого
распределения может быть значительно снижена
.
Для проверки нормального
распределения с оцененными параметрами рассмотрите модифицированный критерий
Колмогорова
-
Смирнова
—
критерий Лильефорса
(
доступен в процедуре Исследовать
).
Как запустить одновыборочный критерий Колмогорова-Смирнова
E
Выберите в меню
:
Анализ > Непараметрические критерии > Устаревшие диалоговые окна > Одновыборочный
Колмогорова-Смирнова...
268
Глава 27
Рисунок 27-55
Диалоговое окно Одновыборочный критерий Колмогорова-Смирнова
E
Выберите одну или несколько числовых переменных для проверки
.
Для каждой переменной
критерий будет рассчитываться отдельно
.
E
По желанию можно щелкнуть по кнопке
Параметры
,
чтобы задать вывод описательных
статистик и квартилей
,
а также параметры обработки пропущенных данных
.
Параметры процедуры Одновыборочный критерий Колмогорова-Смирнова
Рисунок 27-56
Диалоговое окно Одновыборочный критерий Колмогорова-Смирнова
Статистики.
Можно выбрать один или оба параметра вывода итожащих статистик
.
Описательные.
Вывод среднего значения
,
стандартного отклонения
,
минимума
,
максимума и количества непропущенных наблюдений
.
Квартили.
Значения
25-
го
, 50-
го и
75-
го процентилей
.
Пропущенные значения.
Эта группа параметров позволяет управлять обработкой
пропущенных значений
.
Исключать по отдельности.
Если задан расчет нескольких критериев
,
то в каждом из
них пропущенные значения обрабатываются отдельно
.
Исключать целиком.
Наблюдения
,
имеющие пропущенное значения хотя бы в одной
участвующей в анализе переменной
,
исключаются из всех расчетов
.
269
Непараметрические критерии
Команда NPAR TESTS: дополнительные возможности (при вычислении
одновыборочного критерия Колмогорова-Смирнова)
Язык командного синтаксиса также позволяет задавать параметры распределения критериев
(
с помощью подкоманды
K-S
).
Полную информацию о синтаксисе языка команд можно найти в
Руководстве по
синтаксису
.
Критерии для двух независимых выборок
Процедура Критерии для двух независимых выборок сравнивает две группы наблюдений
одной переменной
.
Пример.
Разработана новая разновидность зубных пластинок
,
которые
,
по замыслу их
создателей
,
должны быть более удобными
,
лучше выглядеть и быстрее выравнивать зубы
.
Чтобы понять
,
необходимо ли носить новые зубные пластинки также долго
,
как и старые
зубные пластинки
,
для ношения новых зубных пластинок были случайно отобраны
10
детей
.
Применив
U
-
критерий Манна
-
Уитни можно обнаружить
,
что в среднем детям
,
носившим новые пластинки
,
не приходилось носить их так же долго
,
как и детям
,
носившим старые пластинки
.
Статистики.
Среднее значение
,
стандартное отклонение
,
минимум
,
максимум
,
количество
непропущенных наблюдений и квартили
.
Критерии
:
U
-
критерий Манна
-
Уитни
,
критерий
экстремальных реакций Мозеса
,
Z
-
критерий Колмогорова
-
Смирнова
,
критерий серий
Вальда
-
Вольфовица
.
Данные.
Используйте количественные переменные с упорядоченными значениями
.
Предположения.
Используйте независимые случайные выборки
.
U
-
критерий Манна
-
Уитни
проверяет равенство двух распределений
.
Для того
,
чтобы использовать его для оценки
различий между двумя распределениями
,
необходимо допустить
,
что распределения имеют
одинаковую форму
.
Как запустить процедуру Критерии для двух независимых выборок
E
Выберите в меню
:
Анализ > Непараметрические критерии > Устаревшие диалоговые окна > Для двух
независимых выборок...
270
Глава 27
Рисунок 27-57
Диалоговое окно Критерии для двух независимых выборок
E
Выберите одну или несколько числовых переменных
.
E
Выберите группирующую переменную и щелкните мышью по
Задать группы
,
чтобы
разделить файл на две группы или выборки
.
Типы непараметрических критериев для двух независимых выборок
Тип критерия.
Для проверки гипотезы о том
,
что две независимые выборки
(
группы
)
взяты из одной и той же генеральной совокупности
,
можно воспользоваться четырьмя
критериями
.
U
критерий Манна
-
Уитни
-
наиболее популярный среди непараметрических критериев
для двух независимых выборок
.
Он эквивалентен критерию ранговых сумм Вилкоксона и
критерию Краскала
-
Уоллеса для двух групп
.
Критерий Манна
-
Уитни проверяет гипотезу о
том
,
что две генеральные совокупности
,
из которых были отобраны выборки
,
эквивалентны
по расположению
.
Наблюдения из обеих групп объединяются и ранжируются
,
причем
совпадающим значениям назначается средний ранг
.
Количество совпадающих значений
должно быть мало по сравнению с общим количеством наблюдений
.
Если проверяемые
совокупности эквивалентны по расположению
,
то ранги должны быть распределены между
двумя выборками случайным образом
.
При расчете критерия подсчитываются число раз
,
когда значение из группы
1
предшествует значению из группы
2,
и число раз
,
когда значение
из группы
2
предшествует значению из группы
1.
U
-
статистикой Манна
-
Уитни является
меньшее из этих двух чисел
.
Также отображается статистика ранговой суммы Вилкоксона
W
.
W
представляет собой сумму рангов для группы с меньшим средним рангом
,
если у
групп средние ранги не равны
,
а если равны то это сумма рангов для группы
,
указанной
последней в диалоговом окне Две независимые выборки
:
Задать группы
.
Критерий
Z
Колмогорова
-
Смирнова
и
критерий серий Вальда
-
Вольфовица
носят более общий характер и выявляют различия между распределениями как в
расположении
,
так и в форме
.
Критерий Колмогорова
-
Смирнова основан на максимуме
модуля разности между эмпирическими функциями распределения для обеих выборок
.
271
Непараметрические критерии
Если эта разность значимо велика
,
распределения считаются различными
.
Критерий
серий Вальда
-
Вольфовица объединяет и ранжирует наблюдения из обеих групп
.
Если
обе выборки взяты из одной генеральной совокупности
,
то обе группы должны быть
разбросаны по проранжированным данным случайным образом
.
Критерий экстремальных реакций Мозеса
предполагает
,
что экспериментальная
переменная воздействует на некоторые объекты в одном направлении
,
а на другие объекты в
противоположном
.
Критерий выявляет экстремальные отклики в сравнении с контрольной
группой
.
Он сосредотачивается на размахе контрольной группы и является показателем
того
,
сколь сильно экстремальные значения из экспериментальной группы влияют на
этот размах
,
когда экспериментальной группа объединена с контрольной группой
.
Контрольная группа задается значением для группы
1
в диалоговом окне Две независимые
выборки
:
Задать группы
.
Наблюдения из обеих групп объединяются и ранжируются
.
Размах контрольной группы вычисляется как разность между рангами наибольшего и
наименьшего значений в контрольной группе плюс
1.
Поскольку случайные выбросы могут
легко исказить величину размаха
, 5%
наблюдений с каждого конца контрольной группы
автоматически усекаются
.
Задание групп в процедуре Критерии для двух независимых выборок
Рисунок 27-58
Диалоговое окно Критерии для двух независимых выборок: Задать группы
Чтобы разбить файл на две группы или выборки
,
введите одно целое значение в поле
Группа
1,
а другое целое значение
-
в поле Группа
2.
Наблюдения со всеми прочими
значениями исключаются из анализа
.
Параметры процедуры Критерии для двух независимых выборок
Рисунок 27-59
Диалоговое окно Критерии для двух независимых выборок: Параметры
Статистики.
Можно выбрать один или оба параметра вывода итожащих статистик
.