Файл: Корреляционный анализ.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.12.2023

Просмотров: 38

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Корреляционный анализ
В результате изучения темы студент должен:

знать

- формы (виды) связей между процессами и явлениями в природе и обществе;

- сущность корреляционной связи, её виды по направлению и силе;

- методику вычисления коэффициента корреляции по методу квадратов (Пирсона) и рангов (Спирмена), ошибки и достоверности коэффициентов корреляции;

уметь

- рассчитать коэффициент корреляции по методу квадратов (Пирсона);

- рассчитать коэффициент корреляции по методу рангов (Спирмена);

- определить направление и силу корреляционной связи;

- рассчитать ошибку и достоверность коэффициента корреляции.
Контрольные вопросы

1. Какие формы (виды) связей между процессами и явлениями существуют в природе и обществе?

2. Что такое функциональная связь, и для каких явлений она характерна?

3. Что такое корреляционная связь, и для каких явлений она характерна?

4. Что понимается под прямой и обратной корреляционной связью?

5. Каким образом оценивается сила корреляционной связи между явлениями?

6. Какие существуют методы вычисления коэффициента корреляции?
Логическая структура темы: Корреляционный анализ (приложение 7).
Задача-эталон

Исходные данные

Таблица 1

Температура тела и частота пульса







t тела (x)

Частота пульса (y)

36

60

36

65

36

70

38

80

40

90

40

100


Задание

На основании исходных данных:

1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

2) определить направление и силу связи;

3) рассчитать ошибку коэффициента корреляции
;

4) рассчитать достоверность коэффициента корреляции.


Решение
1. Метод квадратов (Пирсона)

Таблица 2


t тела (x)

Частота пульса (y)

dx

dy

dxdy

dx2

dy2

1.

2.

3.

4.

5.

6.

7.

36

60

–1,7

–17,5

29,75

2,89

306,25

36

65

–1,7

–12,5

21,25

2,89

156,25

36

70

–1,7

–7,5

12,75

2,89

56,25

38

80

+0,3

+2,5

0,75

0,09

6,25

40

90

+2,3

+12,5

28,75

5,29

156,25

40

100

+2,3

+22,5

51,75

5,29

506,25

x = 226

Mx=37,67

y = 465

My=77,5







 = 145,0

 = 19,34

 = 1187,5



1) определяем средние величины (средние арифметические) для двух вариационных рядов (температуры тела и частоты пульса) – графы 1 и 2:

226 465

Mx = ------- = 37,7 My = ------- = 77,5

6 6

2) находим d – отклонение каждой варианты от средней величины для ряда x (dx = x – Mx) и для ряда y (dy = y – My). Полученные результаты заносим в таблицу 2 (графы 3 и 4).

3) вычисляем произведение отклонений каждой варианты от средней величины (dx  dy) и его суммируем ( dxdy ); полученные результаты заносим в таблицу 2 (графа 5).

4) каждое отклонение (dx и dy) возводим в квадрат и суммируем по ряду x – dx2 и по ряду y – dy2. Полученные результаты заносим в таблицу (графы 6 и 7).

5) рассчитываем коэффициент корреляции (rxy

) по формуле:

dх х dy

rxy = ------------------, подставив в неё полученные результаты из таблицы 2:

 dx2 x dy2
 dxxdy 145,0 145,03 145,03

rxy = ----------------- = ---------------------- = ------------- = ------------ = +0,96

dx2xdy2 19,34 х 1187,5 22966,25 151,55
6) рассчитываем ошибку коэффициента корреляции (mrxy) по формуле:
1- rxy2 1 – 0,962 1 – 0,92 0,08

mrxy = ---------- = ------------ = ------------ = -------- = 0,04

√ n – 1 √ 6 – 1 √ 5 2,24
7) рассчитываем достоверность коэффициента корреляции (t) по формуле:

rxy 0,96

t = ------ = --------- = 24,0

mr 0,04


Вывод

Между температурой тела и частотой пульса существует прямая и сильная корреляционная связь, так как коэффициент корреляции равен +0,96. Коэффициент корреляции достоверен (р > 99 %), так как утроенная ошибка, равная 0,04, меньше коэффициента корреляции.*
*С достаточной для медико-социальных исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине трёх своих ошибок (r xy  3mr).
2. Метод рангов (Спирмена)

Таблица 3


to тела (х)

Частота пульса (у)

Порядковый номер – ранги

Разность рангов (d)


d2

х

у

1.

2.

3.

4.

5.

6.

36

60

2

1

+1

1

36

65

2

2

0

0

36

70

2

3

-1

1

38

80

4

4

0

0

40

90

5,5

5

+0,5

0,25

40

100

5,5

6

-0,5

0,25
















 = 2,5



1. Для рассчёта коэффициента методом рангов определяем порядковый номер (ранг) вариант, который cоответствует каждому значению температуры тела и частоты пульса (таблица 3).

При обозначении ранга (порядкового номера) варианты, ранжировать начинают с её меньшего значения в обоих рядах (графы 3 и 4).

Если варианты имеют одинаковое значение (температура тела 36o и 40o), то ранги распределяются следующим образом: температура тела 36o встречается трижды, занимая 1-е, 2-е и 3-е места, следовательно, порядковые номера в этом случае будут равны средней арифметической, занимаемых этими значениями температуры мест (1+2+3) / 3 = 2, т.е. против каждого показателя температуры 36o будет проставлен ранг 2. Для температуры тела 38о ранг равен – 4. Ранги для температуры тела 40o будут равны (5+6) / 2 = 5,5.
2. Определяем разность между рангами (d) по каждой строке – графа 5, возводим её в квадрат (d2) и находим сумму () – графа 6.
3. Коэффициент ранговой корреляции определяем по формуле:

6 х d2

ху = 1 – ----------- , подставив в неё полученные результаты из таблицы 3:

n(n2–1)

6 х 2,5 15 15

ху= 1 – ----------- = 1 – ----------- = 1 – --------- = 1 – 0,07 = +0,93

6(62- 1) 6(36-1) 210
4. Рассчитываем ошибку коэффициента корреляции (mху) по формуле:

1-ху2 1 – 0,932 1 – 0,86 0,14 0,14

mху =  --------- =  ------------ = ----------- = --------- = ----------- = 0,063

√ n – 1 √6 – 1 √ 5 √ 5 2,24

5. Рассчитываем достоверность коэффициента корреляции (t) по формуле:

xy 0,93

t = ------ = --------- = 14,8

mху 0,063



Вывод

Коэффициент корреляции равный + 0,93 позволяет заключить о наличии прямой и сильной связи между температурой тела и частотой пульса. Утроенная ошибка, равная  0,063 меньше коэффициента корреляции, следовательно коэффициент корреляции достоверен (р > 99%).
Задачи для самостоятельного решения
Задачи для студентов, обучающихся по программам специалитета 31.05.01 Лечебное дело, 31.05.02 Педиатрия, 31.05.03 Стоматология, программе бакалавриата 34.03.01 Сестринское дело
Задача 1

Исходные данные
Уровень молочной кислоты в крови и длительность охлаждения организма

Дни охлаждения (х)

Молочная кислота, в мг% (у)

1

7,0

2

7,0

3

7,2

4

7,1

5

8,5

6

8,9

7

8,7

8

9,0

9

9,5

10

9,3



Задание

На основании исходных данных:

1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

2) определить направление и силу связи;

3) рассчитать ошибку коэффициента корреляции;

4) рассчитать достоверность коэффициента корреляции.
Задача 2

Исходные данные
Средняя температура сезона и заболеваемость дизентерией

Годы

Средняя температура сезона, С о (х)

Заболеваемость дизентерией в условн. ед. (у)

2009

14,3

88

2010

15,0

77

2011

14,6

60

2012

13,2

67

2013

15,2

117

2014

15,0

67

2015

14,1

68

2016

13,2

59

2017

17,7

31

2018

14,8

70

2019

17,8

75


Задание

На основании исходных данных:

1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);

2) определить направление и силу связи;

3) рассчитать ошибку коэффициента корреляции;

4) рассчитать достоверность коэффициента корреляции.
Задача 3

Исходные данные
Уровни систолического и диастолического давления (в мм рт. ст.) у 9 здоровых юношей в возрасте 18 лет

Систолическое давление (х)

Диастолическое давление (у)

105

65

115

70

115

65

110

65

110

70

120

75

120

75

120

70

125

75