ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3670
Скачиваний: 4
292
Глава 27
Типы критериев в процедуре Критерии для нескольких независимых выборок
Для проверки гипотезы о том
,
что несколько независимых выборок взяты из одной
и той же генеральной совокупности
,
можно воспользоваться тремя критериями
.
Каждый из критериев
:
критерий
H
Крускала
-
Уоллеса
,
медианный критерий и критерий
Джонкхира
-
Терпстры проверяют
,
взяты ли несколько независимых выборок из одной и
той же генеральной совокупности
.
Критерий
H
Крускала
-
Уоллеса
,
являющийся расширением
критерия
U
Манна
-
Уитни
,
представляет собой непараметрический аналог однофакторного дисперсионного анализа
и используется для выявления различий в расположении распределений выборок
.
Медианный критерий
,
который является более общим
,
но не столь мощным критерием
,
используется для выявления различий между распределениями и в расположении
,
и
в форме
.
Критерий
H
Крускала
-
Уоллеса и медианный критерий предполагают
,
что
k
генеральных совокупностей
,
из которых взяты выборки
,
априори
не упорядочены
.
При
наличии
естественной
априорной
упорядоченности
(
по возрастанию или по
убыванию
)
k
совокупностей более мощным является
критерий Джонкхира
-
Терпстры
.
Например
,
k
совокупностей могут представлять собой
k
возрастающих температур
.
Проверяется гипотеза о том
,
что разные температуры дают одинаковое распределение
откликов
,
против альтернативной гипотезы о том
,
что при увеличении температуры
возрастает и величина отклика
.
Здесь альтернативная гипотеза упорядочена
;
следовательно
,
наиболее подходящим будет критерий Джонкхира
-
Терпстры
.
Критерий
Джонкхира
-
Терпстры доступен
,
только если у Вас установлен модуль
Exact Tests.
Задание диапазона в процедуре Непараметрические критерии для нескольких
независимых выборок
Рисунок 27-79
Диалоговое окно Несколько независимых выборок: Задать диапазон
Чтобы задать диапазон
,
введите целые значения для
Минимума
и
Максимума
,
соответствующие наименьшей и наибольшей категориям группирующей переменной
.
Наблюдения со значениями вне заданного диапазона исключаются из анализа
.
Например
,
если заданы минимальное значение
,
равное
1,
и максимальное значение
,
равное
3,
то будут
использоваться только целые значения от
1
до
3.
Минимальное значение должно быть
меньше максимального
,
и оба значения должны быть заданы
.
293
Непараметрические критерии
Параметры процедуры Непараметрические критерии для нескольких независимых
выборок
Рисунок 27-80
Диалоговое окно Несколько независимых выборок: Параметры
Статистики.
Можно выбрать один или оба параметра вывода итожащих статистик
.
Описательные.
Среднее значение
,
стандартное отклонение
,
минимум
,
максимум и
количество непропущенных наблюдений
.
Квартили.
Значения
25-
го
, 50-
го и
75-
го процентилей
.
Пропущенные значения.
Эта группа параметров позволяет управлять обработкой
пропущенных значений
.
Исключать по отдельности.
Если задан расчет нескольких критериев
,
то в каждом из
них пропущенные значения обрабатываются отдельно
.
Исключать целиком.
Наблюдения
,
имеющие пропущенное значения хотя бы в одной
участвующей в анализе переменной
,
исключаются из всех расчетов
.
Команда NPAR TESTS: дополнительные возможности (при расчете критериев для
нескольких независимых выборок)
Синтаксис языка команд позволяет задавать для медианного критерия значение
,
отличное
от наблюденной медианы
(
подкоманда
MEDIAN
).
Полную информацию о синтаксисе языка команд можно найти в
Руководстве по
синтаксису
.
Критерии для нескольких связанных выборок
Процедура Непараметрические критерии для нескольких связанных выборок позволяет
сравнить распределения двух или большего количества переменных
.
Пример.
Различается ли престиж профессии врача
,
адвоката
,
офицера полиции и учителя
?
Десятерых респондентов попросили расположить эти четыре профессии в порядке
возрастания их престижности
.
Критерий Фридмана показывает
,
что в общественном
мнении престижность этих профессий действительно различна
.
Статистики.
Среднее значение
,
стандартное отклонение
,
минимум
,
максимум
,
количество
непропущенных наблюдений и квартили
.
Критерии
:
Фридмана
,
W
Кендалла и
Q
Кокрена
.
Данные.
Используйте количественные переменные с упорядоченными значениями
.
294
Глава 27
Предположения.
Непараметрические критерии не требуют выполнения каких
-
либо
предположений относительно формы распределения
,
из которого взяты данные
.
Используйте зависимые случайные выборки
.
Как запустить процедуру Непараметрический критерии для нескольких связанных
выборок
E
Выберите в меню
:
Анализ > Непараметрические критерии > Устаревшие диалоговые окна > Для K связанных
выборок...
Рисунок 27-81
Выбор критерия Кокрена в качестве типа критерия
E
Выберите две или большее количество числовых переменных для тестирования
.
Типы критериев, используемых в процедуре Непараметрические критерии для
нескольких связанных выборок
Чтобы сравнить распределения нескольких связанных выборок
,
можно воспользоваться
тремя критериями
.
Критерий Фридмана
-
это непараметрический эквивалент одновыборочного плана
с повторными измерениями или двухфакторного дисперсионного анализа с одним
наблюдением на ячейку
.
Критерия Фридмана проверяют нулевую гипотезу о том
,
что
k
связанных переменных взяты из одной и той же генеральной совокупности
.
Для каждого
наблюдения
k
переменных ранжируются от
1
до
k
.
Статистика критерия основывается
на этих рангах
.
Критерий
W
Кендалла
является нормализацией статистики Фридмана
.
Критерий
W
Кендалла интерпретируется как коэффициент конкордации
(
согласованности
),
который
является показателем согласия среди респондентов
(
экспертов
).
Каждый наблюдение
представляет эксперта
,
каждая переменная
-
оцениваемый объект
.
Для каждой переменной
вычисляется сумма рангов
.
Значение
W
Кендалла изменяется от
0 (
нет согласия
)
до
1
(
полное согласие
).
295
Непараметрические критерии
Критерий
Q
Кокрена
идентичен критерию Фридмана
,
но применяется
,
когда все
отклики являются бинарными
.
Этот критерий является развитием критерия МакНемара
для
k
выборок
.
При помощи критерия
Q
Кокрена проверяют гипотезу о том
,
что несколько
связанных дихотомических переменных имеют одинаковые средние значения
.
Переменные
измеряются на одном и том же объекте или на эквивалентных объектах
.
Статистики критериев для нескольких связанных выборок
Рисунок 27-82
Диалоговое окно Несколько связанных выборок: Статистики
Можно задать вывод следующих статистик
.
Описательные.
Среднее значение
,
стандартное отклонение
,
минимум
,
максимум и
количество непропущенных наблюдений
.
Квартили.
Значения
25-
го
, 50-
го и
75-
го процентилей
.
Команда NPAR TESTS: дополнительные возможности (при расчете критериев для
K связанных выборок)
Полную информацию о синтаксисе языка команд можно найти в
Руководстве по
синтаксису
.
Глава
28
Анализ множественных ответов
Для анализа наборов множественных дихотомий и наборов множественных категорий
предназначены две процедуры
.
Процедура Частоты множественных ответов выводит
частотные таблицы
.
Процедура Таблицы сопряженности множественных ответов выводит
двух
-
и трехмерные таблицы сопряженности
.
Перед использованием любой из этих
процедур необходимо задать анализируемые наборы данных с множественными ответами
.
Пример.
Описываемый пример иллюстрирует использование модели данных с
множественными ответами в маркетинговом исследовании
.
Приведенные здесь данные
являются вымышленными и не должны восприниматься как реальные
.
Итак
,
некая
авиакомпания собирается провести опрос пассажиров
,
летящих по определенному
маршруту
,
с целью оценки конкурирующих авиакомпаний
.
Пусть авиакомпанию
“American
Airlines”
интересует
,
пользуются ли ее пассажиры услугами других авиакомпаний на
маршруте Чикаго
—
Нью
-
Йорк
,
а также относительная важность расписания полетов и
качества обслуживания при выборе авиакомпании
.
Во время посадки на самолет стюардесса
вручает каждому пассажиру краткий вопросник
.
Первый вопрос звучит следующим
образом
: “
Обведите названия авиакомпаний
,
услугами которых Вы воспользовались
хотя бы один раз при полете по этому маршруту в течение последних шести месяцев
—
American, United, TWA, USAir,
Другие
”.
Этот вопрос является вопросом с множественными
ответами
,
поскольку пассажир может отметить более одного ответа
.
Ответы на этот
вопрос нельзя закодировать непосредственно
,
поскольку для каждого наблюдения
переменная может принимать только одно значение
.
Чтобы зафиксировать ответы на
каждый из вопросов
,
вам придется использовать несколько переменных
.
Это можно
сделать двумя способами
.
Первый определить переменную
,
соответствующую каждому
возможному выбору
(
например
,
переменные
American , United, TWA, USAir
и другие
).
Если
пассажир отмечает в вопроснике авиакомпанию
United,
переменной
united
присваивается
значение
1,
в противном случае
0.
Такой подход к кодированию ответов называют
методом множественных дихотомий
.
Ответы можно представить и другим способом с
помощью
метода множественных категорий
,
при использовании которого оценивается
максимальное число возможных ответов на вопрос и вводится такое же число переменных
со значениями
,
указывающими на компанию
,
услугами которой пользовался пассажир
.
Внимательно просматривая заполненные вопросники
,
Вы
,
возможно
,
обнаружите
,
что
в течение последних шести месяцев никто из пассажиров не летал по этому маршруту
самолетами более чем трех различных авиакомпаний
.
Далее Вы увидите
,
что благодаря
сокращению государственного вмешательства в деятельность авиакомпаний в категории
“
Другие
”
были названы
10
авиакомпаний
.
Используя метод множественных категорий
,
Вы
могли бы задать три переменные со значениями
1=
american
, 2=
united
, 3=
twa
, 4=
usair
,
5=
delta
и так далее
.
Если данный пассажир отмечает авиакомпании
American
и
TWA,
то первой переменной присваивается значение
1,
второй
—
значение
3,
а третьей
—
код
пропущенного значения
.
Другой пассажир мог отметить авиакомпании
American
и
Delta.
Тогда первой переменной присваивается значение
1,
второй
—
значение
5,
а третьей
—
код
пропущенного значения
.
Если бы в приведенном примере Вы пользовались для записи
© Copyright IBM Corporation 1989, 2011.
296