ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.11.2021

Просмотров: 3514

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

Глава

13

Частные корреляции

Процедура Частные корреляции вычисляет частные коэффициенты корреляции

,

которые

описывают линейную связь между двумя переменными при устранении влияния одной или
нескольких дополнительных переменных

.

Корреляции

это меры линейной связи

.

Две

переменные могут иметь

полную

связь

,

однако если эта связь нелинейна

,

коэффициент

корреляции не является подходящей статистикой для ее измерения

.

Пример.

Есть ли взаимосвязь между финансированием здравоохранения и уровнем

заболеваемости

?

Хотя вы можете ожидать

,

что такая связь будет отрицательной

,

проведенное исследование показывает наличие значимой

положительной

корреляции

:

по

мере увеличения финансирования здравоохранения увеличивается уровень заболеваемости

.

Фиксация уровня посещаемости медицинских учреждений

,

однако

,

устраняет эту

наблюдаемую положительную корреляцию

.

Финансирование здравоохранения и уровень

заболеваемости только кажутся положительно взаимосвязанными

,

поскольку при

увеличении финансирования больше людей получают доступ к услугам здравоохранения

,

что приводит к выявлению большего числа случаев заболеваний

.

Статистики.

Для каждой переменной

:

число наблюдений без пропущенных значений

,

среднее значение и стандартное отклонение

.

Матрицы корреляций и частных корреляций

со степенями свободы и уровнями значимости

.

Данные.

Используйте симметричные количественные переменные

.

Предположения.

Процедура Частные корреляции предполагает

,

что каждая пара

переменных соответствует двумерному нормальному распределению

.

Как запустить процедуру Частные корреляции

E

Выберите в меню

:

Анализ > Корреляции > Частные...

© Copyright IBM Corporation 1989, 2011.

82


background image

83

Частные корреляции

Рисунок 13-1

Диалоговое окно процедуры “Частные корреляции”

E

Выберите две или более числовые переменные

,

для которых будут вычисляться частные

корреляции

.

E

Выберите одну или несколько числовых переменных

,

влияние которых устраняется

(

Исключаемые

).

Доступны также следующие параметры

:

Критерий значимости.

Вы можете выбрать двухсторонний или односторонний

критерий

.

Если направление связи известно заранее

,

выберите

Односторонний

.

В

противном случае выберите

Двухсторонний

.

Выводить истинный уровень значимости.

По умолчанию для каждого коэффициента

корреляции выводятся вероятность и число степеней свободы

.

Если Вы снимите

пометку с этого элемента

,

коэффициенты корреляции

,

значимые на уровне

0.05,

будут

обозначаться одной звездочкой

,

а значимые на уровне

0.01 —

двумя звездочками

.

При этом числа степеней свободы не выводятся

.

Данная установка относится как к

частным корреляциям

,

так и к корреляциям нулевого порядка

(

т

.

е

.

обычным парным

корреляциям

).


background image

84

Глава 13

Параметры процедуры Частные корреляции

Рисунок 13-2

Диалоговое окно Частные корреляции: Параметры

Статистики.

Вы можете выбрать один или оба из следующих пунктов

:

Средние значения и стандартные отклонения.

Выводятся для каждой переменной

.

Выводится также число наблюдений без пропущенных значений

.

Корреляции нулевого порядка.

Выводится матрица простых корреляций между всеми

переменными

,

в том числе и теми

,

влияние которых будет устраняться

.

Пропущенные значения.

Вы можете выбрать одну из следующих альтернатив

:

Исключать целиком.

Наблюдения с пропущенными значениями любой переменной

,

в том числе и переменной

,

влияние которой устраняется

,

исключаются из всех

вычислений

.

Исключать попарно.

Для вычисления корреляций нулевого порядка

,

на которых

основывается вычисление частных корреляций

,

не будут использоваться наблюдения

с пропущенными значениями для одной или обеих переменных пары

.

Попарное

исключение использует данные в максимально возможной степени

.

Однако

,

в этом

случае число используемых наблюдений может изменяться от одного коэффициента к
другому

.

Когда задано попарное исключение

,

число степеней свободы для конкретного

частного коэффициента основывается на наименьшем числе наблюдений

,

используемых

при вычислении любой из корреляций нулевого порядка

.

Команда PARTIAL CORR: дополнительные возможности

Язык синтаксиса команд также позволяет

:

Считывать корреляционные матрицы нулевого порядка и записывать матрицы частных

корреляций

(

при помощи подкоманды

MATRIX

).

Рассчитывать частные корреляции для переменных в двух списках

(

при помощи

ключевого слова

WITH

в подкоманде

VARIABLES

).

Анализировать несколько наборов переменных

(

при помощи нескольких подкоманд

VARIABLES

).


background image

85

Частные корреляции

Задавать порядок рассчитываемых корреляций

(

например частные корреляции первого

и второго порядка

),

если имеется две контрольные переменные

, (

при помощи

подкоманды

VARIABLES

).

Выводить частные корреляции в компактном формате

(

при помощи подкоманды

FORMAT

).

Выводить матрицу простых корреляций

,

если некоторые коэффициенты не могут быть

рассчитаны

(

при помощи подкоманды

STATISTICS

).

Полную информацию о синтаксисе языка команд можно найти в

Руководстве по

синтаксису

.


background image

Глава

14

Расстояния

Эта процедура вычисляет любую статистику из широкого набора статистик

,

измеряющих

либо сходства

,

либо различия

(

расстояния

),

причем либо между парами переменных

,

либо между парами наблюдений

.

Эти меры сходства или расстояния могут быть затем

использованы в других процедурах

,

таких как факторный анализ

,

кластерный анализ

или многомерное шкалирование

,

для того чтобы помочь анализировать сложные наборы

данных

.

Пример.

Можно ли измерить сходство между парами автомобилей

,

основываясь на

определенных характеристиках

,

таких как объем двигателя

,

расход топлива и мощность

?

Вычислив величины сходства между автомобилями

,

Вы можете получить представление о

том

,

какие автомобили похожи

,

а какие различаются

.

Для более формального анализа к

величинам сходства можно применить иерархический кластерный анализ или многомерное
шкалирование для того

,

чтобы исследовать скрытую структуру данных

.

Статистики.

Меры различия

(

расстояния

)

для интервальных данных

:

расстояние

Евклида

,

квадрат расстояния Евклида

,

метрики Чебышева

,

блок

,

Минковского

,

а также

задаваемые пользователем

.

Для частот

:

хи

-

квадрат и фи

-

квадрат

.

Для бинарных данных

:

расстояние Евклида

,

квадрат расстояния Евклида

,

различие размеров

,

различие структур

,

дисперсия

,

форма

,

Ланс и Вильямс

.

Мерами сходства для интервальных данных являются

:

коэффициент корреляции Пирсона и косинус

.

Для бинарных данных

:

Рассел и Рао

,

простая

мера совпадений

,

Жаккар

,

дайс

,

Роджерс и Танимото

,

Сокал и Сниат

1,

Сокал и Сниат

2,

Сокал и Сниат

3,

Кульчинский

1,

Кульчинский

2,

Сокал и Сниат

4,

Хаманн

,

Лямбда

,

D

Андерберга

,

Y

Юла

,

Q

Юла

,

Очиай

,

Сокал и Сниат

5,

четырехточечная корреляция фи

,

разброс

.

Как получить матрицы расстояний

E

Выберите в меню

:

Анализ > Корреляции > Расстояния...

© Copyright IBM Corporation 1989, 2011.

86