ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3703
Скачиваний: 4
212
Глава 27
Проверить последовательность на случайность.
Для проверки наблюденной
последовательности данных на случайность используется критерий серий
.
Настроить анализ.
Выберите этот вариант при желании вручную внести коррективы в
параметры тестирования на вкладке Параметры
.
Обратите внимание на то
,
что этот
выбор производится автоматически
,
если на вкладке Параметры сделать изменения
,
несовместимые с выбранной целью
.
Чтобы получить одновыборочные непараметрические критерии
Выберите в меню
:
Анализ > Непараметрические критерии > Одновыборочные...
E
Щелкните по кнопке
Запуск
.
Дополнительно Вы можете
:
Задать цель на вкладке Цель
.
Задать назначение полей на вкладке Поля
.
Самостоятельно выбрать параметры на вкладке Параметры
.
Вкладка Поля
Рисунок 27-2
Вкладка Одновыборочные непараметрические критерии: Поля
На вкладке Поля задаются проверяемые поля
.
Использовать заранее заданные роли.
При этом варианте выбора используется
имеющаяся информация о полях
.
Все поля с предопределенными ролями
,
такими как
Входная
,
Целевая или Двойного назначения
,
будут использованы как проверяемые поля
.
Необходимо задать
,
по крайней мере
,
одно поле для проверки
.
213
Непараметрические критерии
Настроить назначение полей.
Этот вариант выбора позволяет не принимать во внимание
роли
,
назначенные полям
.
После выбора этого варианта задайте поля
:
Проверяемые поля.
Выберите одно или несколько полей
.
Вкладка Параметры
Вкладка Параметры содержит несколько различных групп параметров
,
которые можно
изменять
,
чтобы точно настроить то
,
как алгоритм будет обрабатывать имеющиеся данные
.
Если в настройку параметров по умолчанию внести изменения
,
которые несовместимы с
выбранной целью
,
то выбор на вкладке Цели будет автоматически изменен на
Настроить
анализ
.
Выберите критерии
Рисунок 27-3
Параметры группы Выберите критерии (Одновыборочные непараметрические критерии)
Эти параметры определяют
,
какие критерии будут применяться к полям
,
заданным на
вкладке Поля
.
Автоматически выбрать критерии на основе данных.
При выборе этого варианта к
категориальным полям
,
имеющим только две категории
(
с не пропущенными значениями
),
применяется биномиальный критерий
.
Ко всем остальным категориальным полям
применяется критерий хи
-
квадрат
.
К непрерывным полям применяется критерий
Колмогорова
-
Смирнова
.
Настроить критерии.
Этот вариант дает возможность выбрать применяемые критерии
.
Сравнить наблюденную двоичную вероятность с гипотетической (Биномиальный
критерий).
Биномиальный критерий можно применить ко всем полям
.
Применяется
одновыборочный критерий для проверки того
,
соответствует ли выборочное
распределение поля признака
(
категориальное поле с двумя категориями
)
214
Глава 27
заданному биномиальному распределению
.
Дополнительно можно запросить вывод
доверительных интервалов
.
Обратитесь к
Вкладка Параметры Биномиального критерия
за подробностями
,
касающимися параметров критериев
.
Сравнить наблюденные вероятности с гипотетическими (критерий Хи-квадрат).
Критерий хи
-
квадрат применяется к номинальным и порядковым полям
.
Применяется
одновыборочный критерий
,
который вычисляет статистику хи
-
квадрат на основе
разностей между наблюденными и ожидаемыми частотами категорий поля
.
Обратитесь
к
за подробностями
,
касающимися
параметров критериев
.
Сравнить наблюденное распределение с гипотетическим (критерий
Колмогорова-Смирнова).
Критерий Колмогорова
-
Смирнова применяется к
непрерывным полям
.
Применяется одновыборочный критерий для проверки того
,
что
выборочная функция распределения для поля согласуется с равномерным
,
нормальным
или экспоненциальным распределением
,
а также распределением Пуассона
.
Обратитесь
к
Параметры критерия Колмогорова
за подробностями
,
касающимися
параметров критериев
.
Сравнить медиану с гипотетической (критерий знаковых рангов Вилкоксона).
Критерий знаковых рангов Вилкоксона применяется к непрерывным полям
.
Для
проверки медианы значений поля применяется одновыборочный критерий
.
Задайте
число в качестве гипотетического значения медианы
.
Проверить последовательность на случайность (критерий серий).
Критерий серий
применяется ко всем полям
.
Применяется одновыборочный критерий для проверки
того
,
что последовательность значений дихотомизированного поля является случайной
.
Обратитесь к
за подробностями
,
касающимися параметров
критериев
.
Вкладка Параметры Биномиального критерия
Рисунок 27-4
Параметры Биномиального критерия (Одновыборочные непараметрические критерии)
215
Непараметрические критерии
Биномиальный критерий предназначен для полей признаков
(
категориальных полей только
с двумя категориями
),
однако он применяется ко всем полям
,
используя правило задания
“
успеха
”.
Гипотетическая доля.
Здесь задается ожидаемая доля записей
,
заданных как
“
успех
”,
или
p
.
Задайте значение
,
большее
0
и меньшее
1.
Значение по умолчанию равно
0,5.
Доверительный интервал.
Доступны следующие методы вычисления доверительных
интервалов для бинарных данных
:
Клоппер-Пирсон (точный).
Точный интервал
,
основанный на функции распределения
биномиального распределения
.
Джеффриз.
Байесовский интервал
,
основанный на апостериорном распределении
p
при использовании априорного распределения вероятностей Джеффриза
.
Отношение правдоподобия.
Интервал
,
основанный на функции правдоподобия для
p
.
Задать “успех” для категориальных полей.
Здесь задается
,
как для категориальных
полей определяется
“
успех
”,
т
.
е
.
значение или значения
,
доля которых сравнивается с
гипотетической долей
.
Использовать первую категорию, встретившуюся в данных
.
В качестве
“
успеха
”
для
биномиального критерия используется первое значение
,
найденное в выборке
.
Этот
выбор применим только к номинальным и порядковым полям и только с двумя
категориями
.
Все остальные категориальные поля
,
заданные на вкладке Поля
,
проверяться не будут
.
Это задано по умолчанию
.
Задать значения “успеха”
.
Биномиальный критерий применяется с целым списком
значений
,
заданных в качестве
“
успеха
”.
Задайте список текстовых или числовых
значений
.
Значения из списка необязательно должны присутствовать в выборке
.
Задать “успех” для количественных полей.
Здесь задается
,
как для непрерывных полей
определяется
“
успех
”,
т
.
е
.
значение или значения
,
доля которых сравнивается с тестовым
значением
.
Успех задается как значения
,
равные или меньшие
,
чем точка отсечения
.
Средняя точка выборки
задает в качестве точки отсечения среднее значение
минимального и максимального значений
.
Заданная точка отсечения
позволяет задать значение точки отсечения
.
216
Глава 27
Вкладка Параметры критерия Хи-квадрат
Рисунок 27-5
Параметры критерия Хи-квадрат (Одновыборочные непараметрические критерии)
У всех категорий равные вероятности.
Это дает равные частоты всем категориям из
выборки
.
Это задано по умолчанию
.
Задать ожидаемую вероятность.
Это позволяет задать неравные частоты для заданного
списка категорий
.
Задайте список текстовых или числовых значений
.
Значения из списка
необязательно должны присутствовать в выборке
.
В столбце
Категория
задайте значения
категорий
.
В столбце
Относительная частота
для каждой категории задайте положительное
значение
.
Задаваемые частоты рассматриваются как относительные частоты
,
так что
,
например
,
задание частот
1, 2
и
3
эквивалентно заданию частот
10, 20
и
30,
причем оба эти
набора частот говорят о том
,
что ожидается
,
что
1/6
записей попадет в первую категорию
,
1/3 -
во вторую и
1/2 -
в третью
.
Когда задаются ожидаемые вероятности
,
задаваемые
значения категорий должны включать все значения полей в данных
.
В противном случае
для соответствующего поля тест не будет выполнен
.