ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.11.2021

Просмотров: 3703

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

212

Глава 27

Проверить последовательность на случайность.

Для проверки наблюденной

последовательности данных на случайность используется критерий серий

.

Настроить анализ.

Выберите этот вариант при желании вручную внести коррективы в

параметры тестирования на вкладке Параметры

.

Обратите внимание на то

,

что этот

выбор производится автоматически

,

если на вкладке Параметры сделать изменения

,

несовместимые с выбранной целью

.

Чтобы получить одновыборочные непараметрические критерии

Выберите в меню

:

Анализ > Непараметрические критерии > Одновыборочные...

E

Щелкните по кнопке

Запуск

.

Дополнительно Вы можете

:

Задать цель на вкладке Цель

.

Задать назначение полей на вкладке Поля

.

Самостоятельно выбрать параметры на вкладке Параметры

.

Вкладка Поля

Рисунок 27-2

Вкладка Одновыборочные непараметрические критерии: Поля

На вкладке Поля задаются проверяемые поля

.

Использовать заранее заданные роли.

При этом варианте выбора используется

имеющаяся информация о полях

.

Все поля с предопределенными ролями

,

такими как

Входная

,

Целевая или Двойного назначения

,

будут использованы как проверяемые поля

.

Необходимо задать

,

по крайней мере

,

одно поле для проверки

.


background image

213

Непараметрические критерии

Настроить назначение полей.

Этот вариант выбора позволяет не принимать во внимание

роли

,

назначенные полям

.

После выбора этого варианта задайте поля

:

Проверяемые поля.

Выберите одно или несколько полей

.

Вкладка Параметры

Вкладка Параметры содержит несколько различных групп параметров

,

которые можно

изменять

,

чтобы точно настроить то

,

как алгоритм будет обрабатывать имеющиеся данные

.

Если в настройку параметров по умолчанию внести изменения

,

которые несовместимы с

выбранной целью

,

то выбор на вкладке Цели будет автоматически изменен на

Настроить

анализ

.

Выберите критерии

Рисунок 27-3

Параметры группы Выберите критерии (Одновыборочные непараметрические критерии)

Эти параметры определяют

,

какие критерии будут применяться к полям

,

заданным на

вкладке Поля

.

Автоматически выбрать критерии на основе данных.

При выборе этого варианта к

категориальным полям

,

имеющим только две категории

(

с не пропущенными значениями

),

применяется биномиальный критерий

.

Ко всем остальным категориальным полям

применяется критерий хи

-

квадрат

.

К непрерывным полям применяется критерий

Колмогорова

-

Смирнова

.

Настроить критерии.

Этот вариант дает возможность выбрать применяемые критерии

.

Сравнить наблюденную двоичную вероятность с гипотетической (Биномиальный

критерий).

Биномиальный критерий можно применить ко всем полям

.

Применяется

одновыборочный критерий для проверки того

,

соответствует ли выборочное

распределение поля признака

(

категориальное поле с двумя категориями

)


background image

214

Глава 27

заданному биномиальному распределению

.

Дополнительно можно запросить вывод

доверительных интервалов

.

Обратитесь к

Вкладка Параметры Биномиального критерия

за подробностями

,

касающимися параметров критериев

.

Сравнить наблюденные вероятности с гипотетическими (критерий Хи-квадрат).

Критерий хи

-

квадрат применяется к номинальным и порядковым полям

.

Применяется

одновыборочный критерий

,

который вычисляет статистику хи

-

квадрат на основе

разностей между наблюденными и ожидаемыми частотами категорий поля

.

Обратитесь

к

Вкладка Параметры критерия Хи

-

квадрат

за подробностями

,

касающимися

параметров критериев

.

Сравнить наблюденное распределение с гипотетическим (критерий

Колмогорова-Смирнова).

Критерий Колмогорова

-

Смирнова применяется к

непрерывным полям

.

Применяется одновыборочный критерий для проверки того

,

что

выборочная функция распределения для поля согласуется с равномерным

,

нормальным

или экспоненциальным распределением

,

а также распределением Пуассона

.

Обратитесь

к

Параметры критерия Колмогорова

-

Смирнова

за подробностями

,

касающимися

параметров критериев

.

Сравнить медиану с гипотетической (критерий знаковых рангов Вилкоксона).

Критерий знаковых рангов Вилкоксона применяется к непрерывным полям

.

Для

проверки медианы значений поля применяется одновыборочный критерий

.

Задайте

число в качестве гипотетического значения медианы

.

Проверить последовательность на случайность (критерий серий).

Критерий серий

применяется ко всем полям

.

Применяется одновыборочный критерий для проверки

того

,

что последовательность значений дихотомизированного поля является случайной

.

Обратитесь к

Параметры критерия серий

за подробностями

,

касающимися параметров

критериев

.

Вкладка Параметры Биномиального критерия

Рисунок 27-4

Параметры Биномиального критерия (Одновыборочные непараметрические критерии)


background image

215

Непараметрические критерии

Биномиальный критерий предназначен для полей признаков

(

категориальных полей только

с двумя категориями

),

однако он применяется ко всем полям

,

используя правило задания

успеха

”.

Гипотетическая доля.

Здесь задается ожидаемая доля записей

,

заданных как

успех

”,

или

p

.

Задайте значение

,

большее

0

и меньшее

1.

Значение по умолчанию равно

0,5.

Доверительный интервал.

Доступны следующие методы вычисления доверительных

интервалов для бинарных данных

:

Клоппер-Пирсон (точный).

Точный интервал

,

основанный на функции распределения

биномиального распределения

.

Джеффриз.

Байесовский интервал

,

основанный на апостериорном распределении

p

при использовании априорного распределения вероятностей Джеффриза

.

Отношение правдоподобия.

Интервал

,

основанный на функции правдоподобия для

p

.

Задать “успех” для категориальных полей.

Здесь задается

,

как для категориальных

полей определяется

успех

”,

т

.

е

.

значение или значения

,

доля которых сравнивается с

гипотетической долей

.

Использовать первую категорию, встретившуюся в данных

.

В качестве

успеха

для

биномиального критерия используется первое значение

,

найденное в выборке

.

Этот

выбор применим только к номинальным и порядковым полям и только с двумя
категориями

.

Все остальные категориальные поля

,

заданные на вкладке Поля

,

проверяться не будут

.

Это задано по умолчанию

.

Задать значения “успеха”

.

Биномиальный критерий применяется с целым списком

значений

,

заданных в качестве

успеха

”.

Задайте список текстовых или числовых

значений

.

Значения из списка необязательно должны присутствовать в выборке

.

Задать “успех” для количественных полей.

Здесь задается

,

как для непрерывных полей

определяется

успех

”,

т

.

е

.

значение или значения

,

доля которых сравнивается с тестовым

значением

.

Успех задается как значения

,

равные или меньшие

,

чем точка отсечения

.

Средняя точка выборки

задает в качестве точки отсечения среднее значение

минимального и максимального значений

.

Заданная точка отсечения

позволяет задать значение точки отсечения

.


background image

216

Глава 27

Вкладка Параметры критерия Хи-квадрат

Рисунок 27-5

Параметры критерия Хи-квадрат (Одновыборочные непараметрические критерии)

У всех категорий равные вероятности.

Это дает равные частоты всем категориям из

выборки

.

Это задано по умолчанию

.

Задать ожидаемую вероятность.

Это позволяет задать неравные частоты для заданного

списка категорий

.

Задайте список текстовых или числовых значений

.

Значения из списка

необязательно должны присутствовать в выборке

.

В столбце

Категория

задайте значения

категорий

.

В столбце

Относительная частота

для каждой категории задайте положительное

значение

.

Задаваемые частоты рассматриваются как относительные частоты

,

так что

,

например

,

задание частот

1, 2

и

3

эквивалентно заданию частот

10, 20

и

30,

причем оба эти

набора частот говорят о том

,

что ожидается

,

что

1/6

записей попадет в первую категорию

,

1/3 -

во вторую и

1/2 -

в третью

.

Когда задаются ожидаемые вероятности

,

задаваемые

значения категорий должны включать все значения полей в данных

.

В противном случае

для соответствующего поля тест не будет выполнен

.