ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3669
Скачиваний: 4
27
Таблицы сопряженности
Хи-квадрат.
Отметьте
Хи-квадрат
,
чтобы получить значения критериев хи
-
квадрат Пирсона
,
хи
-
квадрат отношения правдоподобия
,
точного критерия Фишера и критерия хи
-
квадрат
с поправкой Йетса
(
с поправкой на непрерывность
)
для таблиц
,
образованных двумя
строками и двумя столбцами
.
Для таблиц
2 × 2
точный критерий Фишера вычисляется в том
случае
,
когда таблица
,
которая не является результатом наличия пропущенных строк или
столбцов в таблице большего размера
,
имеет ожидаемое значение меньше
5
хотя бы в одной
ячейке
.
Для всех остальных таблиц размерности
2 × 2
рассчитывается критерий хи
-
квадрат
с поправкой Йетса
.
Для таблиц с любым числом строк и столбцов отметьте
Хи-квадрат
,
чтобы вывести значения хи
-
квадрата Пирсона и хи
-
квадрат отношения правдоподобия
.
Если обе переменные в таблице являются количественными
,
то при пометке элемента
Хи-квадрат
рассчитывается критерий линейно
-
линейной связи
.
Корреляции.
Для таблиц с упорядоченными переменными по строкам и столбцам при
пометке элемента
Корреляции
вычисляются значения коэффициента корреляции Спирмана
-
ро
(
только для числовых данных
).
ро Спирмана является мерой связи между порядковыми
переменными
.
Если обе переменные в таблице
(
факторы
)
являются числовыми
,
параметр
Корреляции
позволяет вычислить коэффициент корреляции Пирсона
r
,
который
характеризует силу линейной связи между переменными
.
Номинальные.
Для номинальных данных
(
которые не имеют естественного порядка
-
например
,
католическое
,
протестантское
,
иудейское вероисповедание
)
можно выбрать одну
из следующих статистик
:
Коэффициент сопряженности
,
Фи
(
коэффициент
)
и
V Крамéра
,
Лямбда
(
симметричное и асимметричное значения лямбда
,
статистика тау Гудмана и
Краскала
),
Коэффициент неопределенности
.
Коэфф. сопряженности.
Мера связи
,
основанная на хи
-
квадрат
.
Это значение меняется
между
0
и
1,
причем
0
означает отсутствие связи между переменными строки и
столбца
,
а значение
,
близкое к
1, -
высокую степень связи между этими переменными
.
Максимально возможное значение зависит от числа строк и столбцов в таблице
.
Фи и параметр V Крамера.
Мера связи
,
вычисляется делением статистики хи
-
квадрат
на объем выборки и взятием корня квадратного из результата
. V
Крамера
-
это мера
связи
,
основанная на статистике хи
-
квадрат
.
Лямбда.
Мера связи
,
которая отражает относительное снижение ошибки
,
когда
значения независимой переменной используются для предсказания значений зависимой
переменной
.
Значение
1
означает
,
что независимая переменная точно предсказывает
значения зависимой
.
Значение
0
означает
,
что независимая переменная абсолютно
бесполезна для предсказания зависимой
.
Коэфф.неопределенности.
Мера связи
,
указывающая относительное снижение
ошибки в случае
,
когда значения одной переменной используются для предсказания
значений другой
.
Например
,
значение
0.83
указывает на то
,
что знание одной
переменной уменьшает ошибку в предсказании значений другой на
83%.
Вычисляются
как симметричная
,
так и несимметричная версии коэффициента неопределенности
.
Порядковые.
Для таблиц
,
в которых как строки
,
так и столбцы содержат упорядоченные
значения
,
пометьте
Гамма
(
нулевого порядка для двумерных таблиц и условное для таблиц
размерности от
2
до
10),
тау-b Кендалла
и
тау-c Кендалла
.
Для предсказания категорий
столбца по категориям строки
,
пометьте
d Сомерса
.
28
Глава 5
Гамма.
Симметричная мера связи между двумя порядковыми переменными
,
значения
которой меняются между
-1
и
1.
Значения
,
близкие по абсолютной величине к
1,
указывают на сильную связь переменных
.
Значения
,
близкие к
0,
говорят о слабой связи
или ее отсутствии
.
Для таблиц сопряженности двух переменных вычисляется гамма
нулевого порядка
.
Если же таблица сопряженности включает более двух переменных
,
для каждой подтаблицы вычисляется условная гамма
.
d Сомерса.
Мера связи между двумя порядковыми переменными
,
изменяется между
–1
и
1.
Значения
,
близкие по абсолютной величине к
1,
указывают на сильную связь между
двумя переменными
,
а значения
,
близкие к
0, —
на слабую связь или ее отсутствие
.
Это асимметричное расширение меры гамма
,
отличающееся только включением числа
пар
,
не имеющих совпадений
(
связей
)
по независимой переменной
.
Вычисляется также
симметричная версия этой статистики
.
Тау-b Кендалла.
Непараметрическая мера корреляции для порядковых или ранговых
переменных
,
которая учитывает возможные совпадения значений
(
связи
).
Знак
коэффициента указывает направление связи
,
а его модуль
-
силу связи
,
причем
,
чем он
больше
,
тем связь сильнее
.
Значения изменяются в диапазоне между
-1
и
+1,
однако
-1
и
+1
можно получить только для квадратных таблиц
.
Тау-c Кендалла.
Непараметрическая мера связи для порядковых переменных
,
игнорирующая возможные совпадения значений
(
связи
).
Знак коэффициента указывает
направление связи
,
а его модуль
-
силу связи
,
причем
,
чем он больше
,
тем связь сильнее
.
Значения изменяются в диапазоне между
-1
и
+1,
однако
-1
и
+1
можно получить только
для квадратных таблиц
.
Номин./интерв.
В ситуации
,
когда одна из переменных категориальная
,
а другая
-
количественная
,
выберите статистику
Эта
.
Значения категориальной переменной должны
быть закодированы числами
.
Эта.
Мера связи между переменными строки и столбца
,
значения которой изменяются
от
0 (
отсутствие связи
)
до
1 (
сильная связь
).
Индикатор Эта подходит для зависимой
переменной
,
измеренной в интервальной шкале
(
такой
,
как доход
)
и независимой
переменной с ограниченным числом категорий
(
такой
,
как возраст
).
Вычисляются два
значения эта
:
одно рассматривает переменную строки как интервальную переменную
,
а
другое
-
переменную столбца как интервальную переменную
.
Каппа.
Каппа Коэна измеряет согласие мнений двух экспертов
,
оценивающих одни и те
же объекты
.
Значение
1
указывает на полное согласие
.
Значение
0
указывает на то
,
что
согласие
-
не более чем случайность
.
Каппа основывается на квадратной таблице
,
в которой
значения строк и столбцов измерены в одной и той же шкале
.
Любой ячейки
,
которая имеет
наблюденные значения для одной переменной
,
но не имеет для другой
,
присваивается
частота
,
равная
0.
Каппа не вычисляется
,
если тип хранения данных
(
текстовый или
числовой
)
не одинаков для обеих переменных
.
Для текстовых переменных
,
обе переменные
должны иметь одинаковую заданную длину
.
Риск.
Мера силы связи для таблиц
2
х
2
между наличием фактора и наступлением события
.
Если доверительный интервал для этой статистики включает
1,
предположение о том
,
что
фактор связан с событием
,
будет неверным
.
Если наличие фактора встречается редко
,
то в
качестве оценки относительного риска можно использовать отношение шансов
.
29
Таблицы сопряженности
МакНемара.
Непараметрический критерий для двух связанных дихотомических
переменных
.
Проверяет изменения в откликах с помощью распределения хи
-
квадрат
.
Полезен для выявления изменений в откликах
,
обусловленных экспериментальным
вмешательством в планах до
-
и
-
после
.
Для больших квадратных таблиц выдаются
результаты критерия симметричности Мак
-
Немара
-
Боукера
.
Статистики Кокрена и Мантеля-Хенцеля.
Статистики Кокрена и Мантеля
-
Хенцеля
могут использоваться для проверки условной независимости дихотомической факторной
переменной и дихотомической переменной отклика при заданных ковариационных
структурах
,
задаваемых одной или большим числом переменных слоя
(
управляющих
переменных
).
Заметим
,
что в то время как другие статистики вычисляются послойно
,
статистики Кокрена и Мантеля
-
Хенцеля вычисляются сразу для всех слоев
.
Вывод в ячейках для таблиц сопряженности
Рисунок 5-4
Диалоговое окно Таблицы сопряженности: Вывод в ячейках
Чтобы помочь вам выявить структуры в данных
,
которые могут повлиять на результаты
критерия хи
-
квадрат
,
процедура Таблицы сопряженности выводит ожидаемые значения
частот и три типа остатков
(
отклонений
),
которые выступают как меры различия между
ожидаемыми и наблюденными частотами
.
Каждая ячейка таблицы может содержать любую
комбинацию выбранных частот
,
процентов и остатков
.
Частоты.
Число фактически наблюденных наблюдений и число наблюдений
,
ожидаемое
при условии независимости переменных в строках и в столбцах
.
Можно выбрать не
показывать частоты
,
которые меньше заданного целого
.
Скрытые значения будут
выводиться как
<N
,
где
N
-
заданное целое
.
Заданное целое должно быть больше или равно
2,
однако допускается значение
0,
которое говорит о том
,
что скрытые частоты отсутствуют
.
30
Глава 5
Сравнить пропорции столбцов
При выборе этого параметра выполняются попарные
сравнения пропорций столбцов и указывается
,
какие пары столбцов
(
для данной строки
)
значимо различаются
.
Значимые различия в таблице сопряженности указываются с
применением
APA-
стиля форматирования и использованием букв подстрочного индекса
,
и
вычисляются на уровне значимости
0,05.
Примечание
:
Если данный параметр задан без
выбора для вывода наблюденных частот или процентов по столбцам
,
то наблюденные
частоты включаются в таблицу сопряженности с индексами в стиле
APA,
показывающими
результаты применения критерия для сравнения пропорций столбцов
.
Скорректировать p-значения (метод Бонферрони).
При попарных сравнениях
пропорций столбцов используется коррекция Бонферрони
,
которая корректирует
наблюденные уровни значимости
,
учитывая
,
что выполняются несколько сравнений
.
Проценты.
Проценты могут суммироваться по строкам и по столбцам
.
Также доступны
проценты от общего числа наблюдений в таблице
(
один слой
).
Примечание
:
Если в группе
Частоты задать
Скрывать малые количества
,
то проценты
,
относящиеся к скрытым частотам
,
будут также скрыты
.
Остатки.
Обычные нестандартизованные остатки вычисляются как разность между
наблюденными и ожидаемыми значениями
.
Можно также получить значения
стандартизованных и скорректированных стандартизованных остатков
.
Нестандартизованные.
Разность между наблюдаемым и ожидаемым значениями
.
Ожидаемое значение
-
это количество наблюдений в ячейке при условии независимости
переменных строки и столбца
.
Положительное значение остатка указывает на то
,
что
в ячейке имеется больше наблюдений
,
чем в случае
,
если бы переменные строки и
столбца были бы независимыми
.
Стандартизованные.
Остаток
,
деленный на оценку его стандартного отклонения
.
Стандартизованные остатки
,
известные еще как пирсоновские
,
имеют среднее
0
и
стандартное отклонение
1.
Скорректированные стандартизованные.
Остаток в некоторой ячейке
(
наблюдение
минус ожидаемое значение
),
деленный на оценку его стандартной ошибки
.
Полученный
стандартизованный остаток выражается в единицах стандартных отклонений выше
или ниже среднего
.
Нецелочисленные веса.
Частоты в ячейках обычно являются целыми значениями
,
поскольку они представляют числа наблюдений в каждой ячейке
.
Но если наблюдения
в файле данных взвешены с помощью переменной с нецелочисленными значениями
(
например
, 1.25),
то частоты в ячейках могут также быть дробными
.
Округление и усечение
можно применять как до
,
так и после вычислений частот в ячейках
,
а также использовать
дробные частоты в ячейках как для вывода в таблицах
,
так и для вычисления статистик
.
Округлять частоты в ячейках.
Веса наблюдений используются как есть
,
но
накопленные веса в ячейках перед вычислением любых статистик округляются
.
Усекать частоты в ячейках.
Веса наблюдений используются как есть
,
но накопленные
веса в ячейках перед вычислением любых статистик урезаются
.
Округлять веса наблюдений.
Перед применением веса наблюдений округляются
.
31
Таблицы сопряженности
Усекать веса наблюдений.
Перед применением веса наблюдений урезаются
.
Не корректировать.
Веса наблюдений используются как есть
,
также используются
дробные частоты в ячейках
.
Однако когда запрашиваются
Exact Statistics (
доступные
только при установке модуля
Exact Tests),
накопленные веса в ячейках перед
вычислением статистик точных критериев либо усекаются
,
либо округляются
.
Формат таблиц сопряженности
Рисунок 5-5
Диалоговое окно Таблицы сопряженности: Формат
Вы можете расположить строки в порядке возрастания или убывания значений переменной
строки
.