ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.11.2021

Просмотров: 3669

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

27

Таблицы сопряженности

Хи-квадрат.

Отметьте

Хи-квадрат

,

чтобы получить значения критериев хи

-

квадрат Пирсона

,

хи

-

квадрат отношения правдоподобия

,

точного критерия Фишера и критерия хи

-

квадрат

с поправкой Йетса

(

с поправкой на непрерывность

)

для таблиц

,

образованных двумя

строками и двумя столбцами

.

Для таблиц

2 × 2

точный критерий Фишера вычисляется в том

случае

,

когда таблица

,

которая не является результатом наличия пропущенных строк или

столбцов в таблице большего размера

,

имеет ожидаемое значение меньше

5

хотя бы в одной

ячейке

.

Для всех остальных таблиц размерности

2 × 2

рассчитывается критерий хи

-

квадрат

с поправкой Йетса

.

Для таблиц с любым числом строк и столбцов отметьте

Хи-квадрат

,

чтобы вывести значения хи

-

квадрата Пирсона и хи

-

квадрат отношения правдоподобия

.

Если обе переменные в таблице являются количественными

,

то при пометке элемента

Хи-квадрат

рассчитывается критерий линейно

-

линейной связи

.

Корреляции.

Для таблиц с упорядоченными переменными по строкам и столбцам при

пометке элемента

Корреляции

вычисляются значения коэффициента корреляции Спирмана

-

ро

(

только для числовых данных

).

ро Спирмана является мерой связи между порядковыми

переменными

.

Если обе переменные в таблице

(

факторы

)

являются числовыми

,

параметр

Корреляции

позволяет вычислить коэффициент корреляции Пирсона

r

,

который

характеризует силу линейной связи между переменными

.

Номинальные.

Для номинальных данных

(

которые не имеют естественного порядка

-

например

,

католическое

,

протестантское

,

иудейское вероисповедание

)

можно выбрать одну

из следующих статистик

:

Коэффициент сопряженности

,

Фи

(

коэффициент

)

и

V Крамéра

,

Лямбда

(

симметричное и асимметричное значения лямбда

,

статистика тау Гудмана и

Краскала

),

Коэффициент неопределенности

.

Коэфф. сопряженности.

Мера связи

,

основанная на хи

-

квадрат

.

Это значение меняется

между

0

и

1,

причем

0

означает отсутствие связи между переменными строки и

столбца

,

а значение

,

близкое к

1, -

высокую степень связи между этими переменными

.

Максимально возможное значение зависит от числа строк и столбцов в таблице

.

Фи и параметр V Крамера.

Мера связи

,

вычисляется делением статистики хи

-

квадрат

на объем выборки и взятием корня квадратного из результата

. V

Крамера

-

это мера

связи

,

основанная на статистике хи

-

квадрат

.

Лямбда.

Мера связи

,

которая отражает относительное снижение ошибки

,

когда

значения независимой переменной используются для предсказания значений зависимой
переменной

.

Значение

1

означает

,

что независимая переменная точно предсказывает

значения зависимой

.

Значение

0

означает

,

что независимая переменная абсолютно

бесполезна для предсказания зависимой

.

Коэфф.неопределенности.

Мера связи

,

указывающая относительное снижение

ошибки в случае

,

когда значения одной переменной используются для предсказания

значений другой

.

Например

,

значение

0.83

указывает на то

,

что знание одной

переменной уменьшает ошибку в предсказании значений другой на

83%.

Вычисляются

как симметричная

,

так и несимметричная версии коэффициента неопределенности

.

Порядковые.

Для таблиц

,

в которых как строки

,

так и столбцы содержат упорядоченные

значения

,

пометьте

Гамма

(

нулевого порядка для двумерных таблиц и условное для таблиц

размерности от

2

до

10),

тау-b Кендалла

и

тау-c Кендалла

.

Для предсказания категорий

столбца по категориям строки

,

пометьте

d Сомерса

.


background image

28

Глава 5

Гамма.

Симметричная мера связи между двумя порядковыми переменными

,

значения

которой меняются между

-1

и

1.

Значения

,

близкие по абсолютной величине к

1,

указывают на сильную связь переменных

.

Значения

,

близкие к

0,

говорят о слабой связи

или ее отсутствии

.

Для таблиц сопряженности двух переменных вычисляется гамма

нулевого порядка

.

Если же таблица сопряженности включает более двух переменных

,

для каждой подтаблицы вычисляется условная гамма

.

d Сомерса.

Мера связи между двумя порядковыми переменными

,

изменяется между

–1

и

1.

Значения

,

близкие по абсолютной величине к

1,

указывают на сильную связь между

двумя переменными

,

а значения

,

близкие к

0, —

на слабую связь или ее отсутствие

.

Это асимметричное расширение меры гамма

,

отличающееся только включением числа

пар

,

не имеющих совпадений

(

связей

)

по независимой переменной

.

Вычисляется также

симметричная версия этой статистики

.

Тау-b Кендалла.

Непараметрическая мера корреляции для порядковых или ранговых

переменных

,

которая учитывает возможные совпадения значений

(

связи

).

Знак

коэффициента указывает направление связи

,

а его модуль

-

силу связи

,

причем

,

чем он

больше

,

тем связь сильнее

.

Значения изменяются в диапазоне между

-1

и

+1,

однако

-1

и

+1

можно получить только для квадратных таблиц

.

Тау-c Кендалла.

Непараметрическая мера связи для порядковых переменных

,

игнорирующая возможные совпадения значений

(

связи

).

Знак коэффициента указывает

направление связи

,

а его модуль

-

силу связи

,

причем

,

чем он больше

,

тем связь сильнее

.

Значения изменяются в диапазоне между

-1

и

+1,

однако

-1

и

+1

можно получить только

для квадратных таблиц

.

Номин./интерв.

В ситуации

,

когда одна из переменных категориальная

,

а другая

-

количественная

,

выберите статистику

Эта

.

Значения категориальной переменной должны

быть закодированы числами

.

Эта.

Мера связи между переменными строки и столбца

,

значения которой изменяются

от

0 (

отсутствие связи

)

до

1 (

сильная связь

).

Индикатор Эта подходит для зависимой

переменной

,

измеренной в интервальной шкале

(

такой

,

как доход

)

и независимой

переменной с ограниченным числом категорий

(

такой

,

как возраст

).

Вычисляются два

значения эта

:

одно рассматривает переменную строки как интервальную переменную

,

а

другое

-

переменную столбца как интервальную переменную

.

Каппа.

Каппа Коэна измеряет согласие мнений двух экспертов

,

оценивающих одни и те

же объекты

.

Значение

1

указывает на полное согласие

.

Значение

0

указывает на то

,

что

согласие

-

не более чем случайность

.

Каппа основывается на квадратной таблице

,

в которой

значения строк и столбцов измерены в одной и той же шкале

.

Любой ячейки

,

которая имеет

наблюденные значения для одной переменной

,

но не имеет для другой

,

присваивается

частота

,

равная

0.

Каппа не вычисляется

,

если тип хранения данных

(

текстовый или

числовой

)

не одинаков для обеих переменных

.

Для текстовых переменных

,

обе переменные

должны иметь одинаковую заданную длину

.

Риск.

Мера силы связи для таблиц

2

х

2

между наличием фактора и наступлением события

.

Если доверительный интервал для этой статистики включает

1,

предположение о том

,

что

фактор связан с событием

,

будет неверным

.

Если наличие фактора встречается редко

,

то в

качестве оценки относительного риска можно использовать отношение шансов

.


background image

29

Таблицы сопряженности

МакНемара.

Непараметрический критерий для двух связанных дихотомических

переменных

.

Проверяет изменения в откликах с помощью распределения хи

-

квадрат

.

Полезен для выявления изменений в откликах

,

обусловленных экспериментальным

вмешательством в планах до

-

и

-

после

.

Для больших квадратных таблиц выдаются

результаты критерия симметричности Мак

-

Немара

-

Боукера

.

Статистики Кокрена и Мантеля-Хенцеля.

Статистики Кокрена и Мантеля

-

Хенцеля

могут использоваться для проверки условной независимости дихотомической факторной
переменной и дихотомической переменной отклика при заданных ковариационных
структурах

,

задаваемых одной или большим числом переменных слоя

(

управляющих

переменных

).

Заметим

,

что в то время как другие статистики вычисляются послойно

,

статистики Кокрена и Мантеля

-

Хенцеля вычисляются сразу для всех слоев

.

Вывод в ячейках для таблиц сопряженности

Рисунок 5-4

Диалоговое окно Таблицы сопряженности: Вывод в ячейках

Чтобы помочь вам выявить структуры в данных

,

которые могут повлиять на результаты

критерия хи

-

квадрат

,

процедура Таблицы сопряженности выводит ожидаемые значения

частот и три типа остатков

(

отклонений

),

которые выступают как меры различия между

ожидаемыми и наблюденными частотами

.

Каждая ячейка таблицы может содержать любую

комбинацию выбранных частот

,

процентов и остатков

.

Частоты.

Число фактически наблюденных наблюдений и число наблюдений

,

ожидаемое

при условии независимости переменных в строках и в столбцах

.

Можно выбрать не

показывать частоты

,

которые меньше заданного целого

.

Скрытые значения будут

выводиться как

<N

,

где

N

-

заданное целое

.

Заданное целое должно быть больше или равно

2,

однако допускается значение

0,

которое говорит о том

,

что скрытые частоты отсутствуют

.


background image

30

Глава 5

Сравнить пропорции столбцов

При выборе этого параметра выполняются попарные

сравнения пропорций столбцов и указывается

,

какие пары столбцов

(

для данной строки

)

значимо различаются

.

Значимые различия в таблице сопряженности указываются с

применением

APA-

стиля форматирования и использованием букв подстрочного индекса

,

и

вычисляются на уровне значимости

0,05.

Примечание

:

Если данный параметр задан без

выбора для вывода наблюденных частот или процентов по столбцам

,

то наблюденные

частоты включаются в таблицу сопряженности с индексами в стиле

APA,

показывающими

результаты применения критерия для сравнения пропорций столбцов

.

Скорректировать p-значения (метод Бонферрони).

При попарных сравнениях

пропорций столбцов используется коррекция Бонферрони

,

которая корректирует

наблюденные уровни значимости

,

учитывая

,

что выполняются несколько сравнений

.

Проценты.

Проценты могут суммироваться по строкам и по столбцам

.

Также доступны

проценты от общего числа наблюдений в таблице

(

один слой

).

Примечание

:

Если в группе

Частоты задать

Скрывать малые количества

,

то проценты

,

относящиеся к скрытым частотам

,

будут также скрыты

.

Остатки.

Обычные нестандартизованные остатки вычисляются как разность между

наблюденными и ожидаемыми значениями

.

Можно также получить значения

стандартизованных и скорректированных стандартизованных остатков

.

Нестандартизованные.

Разность между наблюдаемым и ожидаемым значениями

.

Ожидаемое значение

-

это количество наблюдений в ячейке при условии независимости

переменных строки и столбца

.

Положительное значение остатка указывает на то

,

что

в ячейке имеется больше наблюдений

,

чем в случае

,

если бы переменные строки и

столбца были бы независимыми

.

Стандартизованные.

Остаток

,

деленный на оценку его стандартного отклонения

.

Стандартизованные остатки

,

известные еще как пирсоновские

,

имеют среднее

0

и

стандартное отклонение

1.

Скорректированные стандартизованные.

Остаток в некоторой ячейке

(

наблюдение

минус ожидаемое значение

),

деленный на оценку его стандартной ошибки

.

Полученный

стандартизованный остаток выражается в единицах стандартных отклонений выше
или ниже среднего

.

Нецелочисленные веса.

Частоты в ячейках обычно являются целыми значениями

,

поскольку они представляют числа наблюдений в каждой ячейке

.

Но если наблюдения

в файле данных взвешены с помощью переменной с нецелочисленными значениями

(

например

, 1.25),

то частоты в ячейках могут также быть дробными

.

Округление и усечение

можно применять как до

,

так и после вычислений частот в ячейках

,

а также использовать

дробные частоты в ячейках как для вывода в таблицах

,

так и для вычисления статистик

.

Округлять частоты в ячейках.

Веса наблюдений используются как есть

,

но

накопленные веса в ячейках перед вычислением любых статистик округляются

.

Усекать частоты в ячейках.

Веса наблюдений используются как есть

,

но накопленные

веса в ячейках перед вычислением любых статистик урезаются

.

Округлять веса наблюдений.

Перед применением веса наблюдений округляются

.


background image

31

Таблицы сопряженности

Усекать веса наблюдений.

Перед применением веса наблюдений урезаются

.

Не корректировать.

Веса наблюдений используются как есть

,

также используются

дробные частоты в ячейках

.

Однако когда запрашиваются

Exact Statistics (

доступные

только при установке модуля

Exact Tests),

накопленные веса в ячейках перед

вычислением статистик точных критериев либо усекаются

,

либо округляются

.

Формат таблиц сопряженности

Рисунок 5-5

Диалоговое окно Таблицы сопряженности: Формат

Вы можете расположить строки в порядке возрастания или убывания значений переменной
строки

.