ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.11.2021

Просмотров: 3488

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

22

Глава 4

Исключать попарно.

Если наблюдения не имеют пропущенных значений для

переменных в группе

(

ячейке

),

то они используются в анализе этой группы

.

Наблюдение

может иметь пропущенные значения для переменных

,

которые используются в других

группах

.

Помещать в отчет.

Пропущенные значения для факторных переменных

рассматриваются как отдельная категория

.

Для этой дополнительной категории

выводится вся информация

,

как и для других категорий

.

Таблицы частот включают

категории

,

соответствующие пропущенным значениям

.

Пропущенные значения для

факторной переменной включаются в анализ

,

но отмечаются как пропущенные

.

Команда EXAMINE: дополнительные возможности

Процедура Исследовать использует синтаксис команды

EXAMINE

.

Язык синтаксиса команд

также позволяет

:

Запросить итоговые вывод и графики в дополнение к выводу и графикам для групп

,

заданных факторными переменными

(

с помощью подкоманды

TOTAL

).

Задать общую шкалу для группы ящичных диаграмм

(

с помощью подкоманды

SCALE

).

Задать взаимодействия факторных переменных

(

с помощью подкоманды

VARIABLES

).

Задать проценты

,

отличные от заданных по умолчанию

(

с помощью подкоманды

PERCENTILES

).

Вычислить проценты

,

используя любой из пяти методов

(

с помощью подкоманды

PERCENTILES

).

Задать любое степенное преобразование для диаграмм разброса по уровням

(

с помощью

подкоманды

PLOT

).

Задать число выводимых экстремальных значений

(

с помощью подкоманды

STATISTICS

).

Задать параметры для М

-

оценок

,

робастных оценок положения

(

с помощью подкоманды

MESTIMATORS

).

Полную информацию о синтаксисе языка команд можно найти в

Руководстве по

синтаксису

.


background image

Глава

5

Таблицы сопряженности

Процедура Таблицы сопряженности формирует двумерные и многомерные таблицы

,

а

также вычисляет целый ряд критериев и мер силы связи для двумерных таблиц

.

Структура

таблицы и то

,

упорядочены категории или нет

,

определяет

,

какие меры и критерии

использовать

.

Статистики таблиц сопряженности и меры силы связи вычисляются только для

двумерных таблиц

.

Если Вы задали строку

,

столбец и фактор слоя

(

управляющую

переменную

),

то процедура Таблицы сопряженности формирует панель соответствующих

статистик и мер для каждого значения фактора слоя

(

или комбинации значений

,

если

факторов два или более

).

Например

,

если

пол

-

это фактор слоя для таблицы переменных

состоит в браке

(

да

,

нет

)

и

жизнь

(

как воспринимается жизнь

-

волнующая

,

обычная или

скучная

),

то результаты двумерной таблицы будут вычисляться отдельно для женщин и

отдельно для мужчин

,

и выводиться в виде двух панелей

,

расположенных одна за другой

.

Пример.

Верно ли

,

что клиенты мелких компаний приносят больший доход от продажи им

услуг

(

например

,

консультации или тренинг

),

чем клиенты крупных компаний

?

Из таблицы

сопряженности вы

,

возможно

,

увидите

,

что большинство мелких компаний

(

менее

500

работников

)

приносят высокий доход

,

тогда как большинство крупных компаний

(

более

2 500

работников

)

приносят низкий доход

.

Статистики и меры силы связи.

Хи

-

квадрат Пирсона

,

хи

-

квадрат отношение

правдоподобия

,

критерий линейно

-

линейной связи

,

точный критерий Фишера

,

скорректированный хи

-

квадрат Йетса

,

r

Пирсона

,

ро Спирмана

,

коэффициент

сопряженности

,

фи

,

V

Крам

é

ра

,

симметричное и несимметричное лямбда

,

тау Гудмана

и Краскала

,

коэффициент неопределенности

,

гамма

,

d

Сомерса

,

тау

-

b

Кендалла

,

тау

-

c

Кендалла

,

коэффициент эта

,

каппа Коэна

,

оценка относительного риска

,

отношение

шансов

,

критерий МакНемара

,

статистики Кокрена и Мантеля

-

Хенцеля

,

а также статистики

пропорций столбцов

.

Данные.

Для того чтобы задать категории каждой из использующихся в таблице

переменных

,

используйте значения числовых или текстовых

(

длиной до восьми байт

)

переменных

.

Например

,

значения переменной

пол

можно закодировать как

1

и

2

или как

мужской

и

женский

.

Предположения.

Для вычисления некоторых статистик и мер требуется

,

чтобы категории

были упорядочены

(

порядковые данные

)

или чтобы значения были количественными

(

интервальные данные или данные

,

заданные в шкале отношений

).

Применение других

статистик корректно и в том случае

,

когда категории переменных в таблице не упорядочены

(

номинальные данные

).

Для статистик

,

в основе которых лежит критерий хи

-

квадрат

(

статистика фи

,

статистика

V

Крам

é

ра

,

коэффициент сопряженности

),

данные должны

представлять собой случайную выборку из мультиномиального распределения

.

Примечание

:

Порядковые переменные должны иметь или числовые значения

,

представляющие категории

(

например

, 1=

низкий

, 2=

средний

, 3=

высокий

),

или текстовые

значения

.

Однако

,

предполагается

,

что алфавитный порядок строковых значений отражает

© Copyright IBM Corporation 1989, 2011.

23


background image

24

Глава 5

истинный порядок категорий

.

Например

,

для строковой переменной со значениями

низкий

,

средний

,

высокий

интерпретируемый порядок категорий следующий

:

высокий

,

низкий

,

средний

,

что не соответствует правильному порядку

.

Вообще говоря

,

для представления

порядковых данных надежнее использовать числовые коды

.

Как построить таблицу сопряженности

E

Выберите в меню

:

Анализ > Описательные статистики > Таблицы сопряженности...
Рисунок 5-1

Диалоговое окно Таблицы сопряженности

E

Выберите одну или несколько переменных для строк и одну или несколько переменных

для столбцов

.

Дополнительно Вы можете

:

Выбрать одну или несколько управляющих

(

слоевых

)

переменных

.

Щелкнуть мышью по кнопке

Статистики

и выбрать нужные критерии и меры силы связи

для двумерных таблиц или подтаблиц

.

Щелкнуть мышью по кнопке

Ячейки

,

чтобы задать вывод наблюденных и ожидаемых

значений

,

процентов

,

а также остатков

.

Щелкнуть мышью по кнопке

Формат

для задания порядка

,

в котором следует

располагать категории

.

Слои таблиц сопряженности

Если вы выбрали одну или несколько слоевых переменных

,

то для каждого значения

каждой слоевой переменной

(

управляющей переменной

)

строится отдельная таблица

сопряженности

.

Так

,

если у вас имеется одна переменная строки

,

одна переменная столбца

и одна переменная слоя с двумя значениями

,

то Вы получите по отдельной двухмерной


background image

25

Таблицы сопряженности

таблице для каждой категории переменной слоя

.

Чтобы задать другие слои управляющих

переменных

,

щелкните по

Далее

.

Подтаблицы строятся для каждой комбинации категорий

первой слоевой переменной и второй слоевой переменной и так далее

.

Если запрошен

вывод статистик и мер силы связи

,

то они вычисляются только для двумерных подтаблиц

.

Кластеризованные столбиковые диаграммы в процедуре

Таблицы сопряженности

Вывести кластеризованные столбиковые диаграммы.

Кластеризованная столбиковая

диаграмма помогает подытожить данные для групп наблюдений

.

Каждому значению

переменной

,

заданному в списке Строки

,

соответствует кластер столбиков диаграммы

.

Переменной

,

которая формирует столбики в кластерах

,

является переменная

,

задаваемая в

списке Столбцы

.

Каждому значению этой переменной соответствуют окрашенные одним

цветом или одинаково заштрихованные столбики диаграммы

.

Если в списках Строки или

Столбцы задано более одной переменной

,

то кластеризованная столбиковая диаграмма

строится для каждой комбинации переменных из этих двух списков

.

Таблицы сопряженности, выводящие переменные слоев

в слоях таблицы

Вывод переменных в слоях таблиц

Можно задать вывод переменных слоев

(

управляющих

переменных

)

в качестве переменных слоев в таблице сопряженности

.

Это дает возможность

представлять таблицы таким образом

,

чтобы статистики выводились для переменных строк

и столбцов

,

и при этом их можно было бы увидеть по категориям переменных слоев

.

Ниже приведен пример

,

использующий файл данных

demo.sav

(),

который воспроизводится

следующим образом

:

E

Выберите

Категория дохода домохозяйства

(inccat)

в качестве переменной строки

,

Наличие

персонального цифрового помощника

(PDA) (ownpda)

в качестве переменной столбца и

Уровень образования

(ed)

в качестве переменной слоя

.

E

Выберите

Выводить переменные слоев в слоях таблицы

.

E

В диалоговом окне Вывод в ячейках выберите

По столбцу

.

E

Запустите процедуру Таблицы сопряженности

,

дважды щелкните по таблице

сопряженности

,

и в раскрывающемся списке Уровень образования выберите

Высшее

.


background image

26

Глава 5

Рисунок 5-2

Таблица сопряженности с переменными слоев в слоях таблицы

В выбранном представлении таблицы сопряженности можно увидеть статистики для
респондентов с высшим образованием

.

Статистики, рассчитываемые для таблиц сопряженности

Рисунок 5-3

Диалоговое окно Таблицы сопряженности: Статистики