ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.01.2024

Просмотров: 455

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

УТВЕРЖДАЮ:
ФИО
должность
Для свободного использования в образовательных целях
Copyright
© Академия НАФИ. Москва
Все права защищены nafi.ru
КОРРЕЛЯЦИОННЫЙ
АНАЛИЗ
ТЕМА 6

1.
Корреляция: определение, основные
характеристики. Корреляционный анализ
2.
Парные статистические связи
2.1
Коэффициент корреляции Пирсона (метрические шкалы)
2.2
Коэффициент ранговой корреляции Спирмена
(
неметрические шкалы)
2.3
Коэффициент ранговой корреляции Кендалла
2.4
Коэффициент ранговой корреляции Гудмена -
Краскела
ОГЛАВЛЕНИЕ
2

1.
КОРРЕЛЯЦИИ:
ОПРЕДЕЛЕНИЕ,
ОСНОВНЫЕ
ХАРАКТЕРИСТИКИ.
КОРРЕЛЯЦИОННЫЙ
АНАЛИЗ

Изучение связей между переменными, интересует исследователя с точки зрения отражения соответствующих причинно-следственных отношений.
Корреляционная зависимость
– это согласованные изменения двух (парная корреляционная связь) или большего количества признаков (множественная корреляционная связь). Суть ее заключается в том, что при изменении значения одной переменной происходит закономерное изменение (уменьшение или увеличение) другой(-их) переменной(-ых).
Корреляционный анализ
– статистический метод, позволяющий с использованием коэффициентов корреляции определить, существует ли зависимость между переменными и насколько она сильна.
Коэффициент корреляции
– двумерная описательная статистика, количественная мера взаимосвязи (совместной изменчивости) двух переменных.
4
1.
Корреляционный анализ

Корреляция
Форма
Направление
Сила
Линейная
Нелинейная
Прямая
Обратная

При
положительной линейной корреляции
более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака – низкие значения другого.

При
отрицательной линейной корреляции
более высоким значениям одного признака соответствуют более низкие значения другого, а более низким значениям одного признака – высокие значения другого.
-1
……0……+1 5
1.
Корреляционный анализ
Характер связи между переменными

1.
Прямая причинно-следственная связь
- переменная Х определяет значение переменной У.
Пример: Наличие воды ускоряет рост растений. Яд вызывает смерть.
Температура воздуха прямо влияет на скорость таяния льда.
2.
Обратная причинно-следственная связь
- переменная У определяет значение переменной Х.
Пример: Исследователь может думать, что чрезмерное потребление кофе вызывает нервозность. Но, может быть, очень нервный человек выпивает кофе, чтобы успокоить свои нервы?
6
1.
Корреляционный анализ
Виды связи между переменными


3.
Связь, вызванная третьей (скрытой) переменной.
Пример: существует зависимость между числом утонувших людей и числом выпитых безалкогольных напитков в летнее время. Однако, обе переменные связаны с жарой и потребностью людей во влаге?
4.
Связь, вызванная несколькими скрытыми переменными.
Пример: Исследователь может обнаружить значимую связь между оценками студентов в университете и оценками в школе. Но действуют и другие переменные: IQ, количество часов занятий, влияние родителей, мотивация, возраст, авторитет преподавателей
5.
Связи нет, наблюдаемая зависимость случайна.
Пример: Исследователь может найти связь между увеличением количества людей, которые занимаются спортом и увеличением количества людей, которые совершают преступления. Но здравый смысл говорит, что любая связь между этими двумя переменными является случайной.
7
1.
Корреляционный анализ
Виды связи между переменными

Стаж менеджера по продажам на фирме
Успеваемость студента
Годовой объем продаж
Успеваемость в школе
Коэффициент
IQ
Время на занятия
Простая связь
8
1.
Корреляционный анализ
Множественная связь
Виды связи между переменными


Наглядное представление о связи двух переменных дает
график рассеяния
, на котором каждый объект представляет собой точку, координаты которой заданы значениями двух переменных. Таким образом, множество объектов представляет собой на графике множество точек. По конфигурации этого множества точек можно судить о характере связи между двумя переменными.

Команда «Графика» → «Рассеяния/Точки».
9
1.
Корреляционный анализ
График рассеяния (Scatter Plot)

Пример: Рассматриваем две переменные: «Продолжительность подготовки (часов)»
студентов перед экзаменом и «Итоговая оценка» (из 100 балов). Пытаемся визуально определить связь. Правда ли, что чем больше времени уделено подготовке, тем выше оценка? (Ответ на этот вопрос будет дан далее при расчете коэффициента корреляции
Пирсона)
10
1.
Корреляционный анализ
График рассеяния (Scatter Plot)

Сила связи
не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.
Коэффициент корреляции (r)
– это показатель, величина которого варьируется в пределах от –1 до +1.

Если коэффициент корреляции равен 0, обе переменные линейно независимы друг от друга.
11
1.
Корреляционный анализ
Сила корреляции
ЗНАЧЕНИЕ
(по модулю)
ИНТЕРПРЕТАЦИЯ
до 0,2
до 0,5
до 0,7
до 0,9
свыше 0,9
очень слабая корреляция слабая корреляция средняя корреляция высокая корреляция очень высокая корреляция


Сила корреляции
12
1.
Корреляционный анализ

13
Диаграмма рассеяния
(Scatterplot, Scatter diagram)
Характеристики диаграммы:

наклон (направление связи)

ширина (сила, теснота связи)
О силе связи можно судить по тому, насколько тесно расположены точки-объекты около линии регрессии - чем ближе точки к линии, тем сильнее связь
1.
Корреляционный анализ

Направление корреляции
14
Пример: На графике видно, что имеет место отрицательная линейная
зависимость. Это означает, что увеличение переменной X приводит к уменьшению переменной Y.
1.
Корреляционный анализ
а) строгая положительная корреляция б) положительная корреляция в) слабая положительная корреляция г) нулевая корреляция д) отрицательная корреляция е) строгая отрицательная корреляция ж) нелинейная корреляция з) нелинейная корреляция
15
Примеры корреляций
1.
Корреляционный анализ

16
Ложная корреляция
1.
Корреляционный анализ
Пример: «Аисты приносят детей»
Изучалась корреляция между числом аистов, свивших гнезда в южных районах
Швеции, и рождаемостью в эти же годы в Швеции. Вычисления показали высокую положительную корреляцию между этими явлениями. Однако причинная зависимость не может быть выведена ни из какого наблюдаемого совместного изменения явлений. Оказалось, что одновременные синхронные изменения числа аистов и детей объясняются изменением среднего уровня жизни жителей Стокгольма. При исключении этой искажающей переменной прежней корреляции уже не наблюдалось.

Если между двумя исследуемыми величинами установлена тесная зависимость, то из этого еще не следует их причинная взаимообусловленность. За счет эффектов одновременного влияния неучтенных факторов смысл истинной связи может искажаться. Поэтому такую корреляцию часто называют
«ложной»

Для выявления «ложной» корреляции используются
частные корреляции

Частная корреляция

Если две переменные коррелируют, всегда можно предположить, что эта корреляция обусловлена влиянием третьей переменной, как общей причины совместной изменчивости первых двух переменных.

Для проверки этого предположения достаточно исключить влияние этой
третьей переменной и вычислить корреляцию двух переменных без учета влияния третьей переменой (при фиксированных ее значениях).

Корреляция, вычисленная таким образом называется
частной
17
1.
Корреляционный анализ


18
Частная корреляция
1.
Корреляционный анализ

Перенести необходимые переменные для вычисления корреляции в
«Переменные».

Перенести дополнительную переменную, которая предположительно влияет на вышеуказанные переменные, в «Исключаемые».

1.
Для порядковых данных используются следующие коэффициенты корреляции:

ρ - коэффициент ранговой корреляции Спирмена

τ - коэффициент ранговой корреляции Кендалла

γ - коэффициент ранговой корреляции Гудмена – Краскела
2.
Для переменных с интервальной и номинальной шкалой используется коэффициент
корреляции Пирсона (корреляция моментов произведений).
3.
Если, по меньшей мере, одна из двух переменных имеет порядковую шкалу, либо не является нормально распределённой, используется ранговая корреляция Спирмана или τ-Кендалла.
Применение коэффициента Кендалла предпочтительно, если в исходных данных имеются выбросы.
Типы шкал
Мера связи
Переменная X
Переменная Y
Интервальная или отношений
Интервальная или отношений
Коэффициент Пирсона
Ранговая, интервальная или отношений Ранговая, интервальная или отношений Коэффициент Спирмена
Ранговая
Ранговая
Коэффициент Кендалла
Дихотомическая
Дихотомическая
Коэффициент φ,
Дихотомическая
Ранговая
Рангово-бисериальный коэффициент
Дихотомическая
Интервальная или отношений
Бисериальный коэффициент
Интервальная
Ранговая
Не разработан
19
1.
Корреляционный анализ
Коэффициенты корреляции

Пример:
1.
Массив данных fashion.sav.
2.
Задача: Узнать, есть ли зависимость между интересом к моде (Q1) и тем, сколько денег человек тратит за один поход в магазин за одеждой (Q3).
20
1.
Корреляционный анализ
Взаимосвязь количественных переменных

21
Варианты расчета коэффициентов
Вариант 1
Команда «Таблицы сопряженности» → «Статистики» → «Корреляции»
(рассчитываются коэффициенты Пирсона и Спирмена для двух переменных)
Взаимосвязь количественных переменных
1.
Корреляционный анализ

22
Вариант 2
Команда «Анализ» → «Корреляции» → «Парная»
(рассчитываются коэффициенты Пирсона, Спирмена, Кендалла попарно для любого количества переменных)
1.
Корреляционный анализ
Взаимосвязь количественных переменных


Вариант 3
Команда «Graphs» → «Scatter» → «Simple» (графическая визуализация)
R= 0,344
23
1.
Корреляционный анализ
Взаимосвязь количественных переменных

24
1.
Корреляционный анализ
Помимо значений корреляции, вычисляются уровни значимости.
В SPSS можно использовать односторонний и двусторонний тест значимости.
Обычно используют двусторонний.
Уровень значимости

25
Уровень значимости
1.
Корреляционный анализ
По умолчанию отмечено «Метить значимые корреляции»
Уровень значимости
Помечены в SPSS значения корреляции
От 0,01 до 0,05
*
От 0 до 0,01
**

2.
ПАРНЫЕ
СТАТИСТИЧЕСКИЕ
СВЯЗИ

2.1
КОЭФФИЦИЕНТ
КОРРЕЛЯЦИИ
ПИРСОНА
(МЕТРИЧЕСКИЕ
ШКАЛЫ)

28
стандартное отклонение для роста стандартное отклонение для веса
1



n
z
z
r
i
i
Y
X
X
i
X
s
X
X
z
i


Y
i
Y
s
Y
Y
z
i


для каждого X и Y (для каждого респондента)
Вес
Рост
Дима
72 160
Гриша 66 144
Миша
68 154
Коля
74 210
Федя
68 182
Рома
64 159 68,7 168,2
Коэффициент корреляции r-Пирсона
является мерой прямолинейной связи между переменными: его значения достигают максимума, когда точки на графике двумерного рассеяния лежат на одной прямой линии.
Пример: Исследование взаимосвязи веса и роста.
2.1. Коэффициент корреляции Пирсона

Значение r – Пирсона характеризует уровень связи между переменными:

0,75
– 1.00 очень высокая положительная

0,50
– 0.74 высокая положительная

0,25
– 0.49 средняя положительная

0,00
– 0.24 слабая положительная

0,00
– -0.24 слабая отрицательная

-0,25
– -0.49 средняя отрицательная

-0,50
– -0.74 высокая отрицательная

-0,75
– -1.00 очень высокая отрицательная
29
2.1. Коэффициент корреляции Пирсона
Интерпретация результатов

Результаты коэффициента корреляции r – Пирсона для примера со студентами
30
2.1. Коэффициент корреляции Пирсона

31
Оценка статистической значимости
коэффициента корреляции
Критическое значение t-критерия определяется из таблицы значений
t- распределения для выбранного уровня значимости α и числа степеней свободы df=n–2
1 2
2
r
n
r
t



2.1. Коэффициент корреляции Пирсона