ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.12.2023
Просмотров: 38
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Корреляционный анализ
В результате изучения темы студент должен:
знать
- формы (виды) связей между процессами и явлениями в природе и обществе;
- сущность корреляционной связи, её виды по направлению и силе;
- методику вычисления коэффициента корреляции по методу квадратов (Пирсона) и рангов (Спирмена), ошибки и достоверности коэффициентов корреляции;
уметь
- рассчитать коэффициент корреляции по методу квадратов (Пирсона);
- рассчитать коэффициент корреляции по методу рангов (Спирмена);
- определить направление и силу корреляционной связи;
- рассчитать ошибку и достоверность коэффициента корреляции.
Контрольные вопросы
1. Какие формы (виды) связей между процессами и явлениями существуют в природе и обществе?
2. Что такое функциональная связь, и для каких явлений она характерна?
3. Что такое корреляционная связь, и для каких явлений она характерна?
4. Что понимается под прямой и обратной корреляционной связью?
5. Каким образом оценивается сила корреляционной связи между явлениями?
6. Какие существуют методы вычисления коэффициента корреляции?
Логическая структура темы: Корреляционный анализ (приложение 7).
Задача-эталон
Исходные данные
Таблица 1
Температура тела и частота пульса
| |
t тела (x) | Частота пульса (y) |
36 | 60 |
36 | 65 |
36 | 70 |
38 | 80 |
40 | 90 |
40 | 100 |
Задание
На основании исходных данных:
1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);
2) определить направление и силу связи;
3) рассчитать ошибку коэффициента корреляции
;
4) рассчитать достоверность коэффициента корреляции.
Решение
1. Метод квадратов (Пирсона)
Таблица 2
t тела (x) | Частота пульса (y) | dx | dy | dxdy | dx2 | dy2 |
1. | 2. | 3. | 4. | 5. | 6. | 7. |
36 | 60 | –1,7 | –17,5 | 29,75 | 2,89 | 306,25 |
36 | 65 | –1,7 | –12,5 | 21,25 | 2,89 | 156,25 |
36 | 70 | –1,7 | –7,5 | 12,75 | 2,89 | 56,25 |
38 | 80 | +0,3 | +2,5 | 0,75 | 0,09 | 6,25 |
40 | 90 | +2,3 | +12,5 | 28,75 | 5,29 | 156,25 |
40 | 100 | +2,3 | +22,5 | 51,75 | 5,29 | 506,25 |
x = 226 Mx=37,67 | y = 465 My=77,5 | | | = 145,0 | = 19,34 | = 1187,5 |
1) определяем средние величины (средние арифметические) для двух вариационных рядов (температуры тела и частоты пульса) – графы 1 и 2:
226 465
Mx = ------- = 37,7 My = ------- = 77,5
6 6
2) находим d – отклонение каждой варианты от средней величины для ряда x (dx = x – Mx) и для ряда y (dy = y – My). Полученные результаты заносим в таблицу 2 (графы 3 и 4).
3) вычисляем произведение отклонений каждой варианты от средней величины (dx dy) и его суммируем ( dxdy ); полученные результаты заносим в таблицу 2 (графа 5).
4) каждое отклонение (dx и dy) возводим в квадрат и суммируем по ряду x – dx2 и по ряду y – dy2. Полученные результаты заносим в таблицу (графы 6 и 7).
5) рассчитываем коэффициент корреляции (rxy
) по формуле:
dх х dy
rxy = ------------------, подставив в неё полученные результаты из таблицы 2:
dx2 x dy2
dxxdy 145,0 145,03 145,03
rxy = ----------------- = ---------------------- = ------------- = ------------ = +0,96
dx2xdy2 19,34 х 1187,5 22966,25 151,55
6) рассчитываем ошибку коэффициента корреляции (mrxy) по формуле:
1- rxy2 1 – 0,962 1 – 0,92 0,08
mrxy = ---------- = ------------ = ------------ = -------- = 0,04
√ n – 1 √ 6 – 1 √ 5 2,24
7) рассчитываем достоверность коэффициента корреляции (t) по формуле:
rxy 0,96
t = ------ = --------- = 24,0
mr 0,04
Вывод
Между температурой тела и частотой пульса существует прямая и сильная корреляционная связь, так как коэффициент корреляции равен +0,96. Коэффициент корреляции достоверен (р > 99 %), так как утроенная ошибка, равная 0,04, меньше коэффициента корреляции.*
*С достаточной для медико-социальных исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине трёх своих ошибок (r xy 3mr).
2. Метод рангов (Спирмена)
Таблица 3
to тела (х) | Частота пульса (у) | Порядковый номер – ранги | Разность рангов (d) | d2 | |
х’ | у’ | ||||
1. | 2. | 3. | 4. | 5. | 6. |
36 | 60 | 2 | 1 | +1 | 1 |
36 | 65 | 2 | 2 | 0 | 0 |
36 | 70 | 2 | 3 | -1 | 1 |
38 | 80 | 4 | 4 | 0 | 0 |
40 | 90 | 5,5 | 5 | +0,5 | 0,25 |
40 | 100 | 5,5 | 6 | -0,5 | 0,25 |
| | | | | = 2,5 |
1. Для рассчёта коэффициента методом рангов определяем порядковый номер (ранг) вариант, который cоответствует каждому значению температуры тела и частоты пульса (таблица 3).
При обозначении ранга (порядкового номера) варианты, ранжировать начинают с её меньшего значения в обоих рядах (графы 3 и 4).
Если варианты имеют одинаковое значение (температура тела 36o и 40o), то ранги распределяются следующим образом: температура тела 36o встречается трижды, занимая 1-е, 2-е и 3-е места, следовательно, порядковые номера в этом случае будут равны средней арифметической, занимаемых этими значениями температуры мест (1+2+3) / 3 = 2, т.е. против каждого показателя температуры 36o будет проставлен ранг 2. Для температуры тела 38о ранг равен – 4. Ранги для температуры тела 40o будут равны (5+6) / 2 = 5,5.
2. Определяем разность между рангами (d) по каждой строке – графа 5, возводим её в квадрат (d2) и находим сумму () – графа 6.
3. Коэффициент ранговой корреляции определяем по формуле:
6 х d2
ху = 1 – ----------- , подставив в неё полученные результаты из таблицы 3:
n(n2–1)
6 х 2,5 15 15
ху= 1 – ----------- = 1 – ----------- = 1 – --------- = 1 – 0,07 = +0,93
6(62- 1) 6(36-1) 210
4. Рассчитываем ошибку коэффициента корреляции (mху) по формуле:
1-ху2 1 – 0,932 1 – 0,86 0,14 0,14
mху = --------- = ------------ = ----------- = --------- = ----------- = 0,063
√ n – 1 √6 – 1 √ 5 √ 5 2,24
5. Рассчитываем достоверность коэффициента корреляции (t) по формуле:
xy 0,93
t = ------ = --------- = 14,8
mху 0,063
Вывод
Коэффициент корреляции равный + 0,93 позволяет заключить о наличии прямой и сильной связи между температурой тела и частотой пульса. Утроенная ошибка, равная 0,063 меньше коэффициента корреляции, следовательно коэффициент корреляции достоверен (р > 99%).
Задачи для самостоятельного решения
Задачи для студентов, обучающихся по программам специалитета 31.05.01 Лечебное дело, 31.05.02 Педиатрия, 31.05.03 Стоматология, программе бакалавриата 34.03.01 Сестринское дело
Задача 1
Исходные данные
Уровень молочной кислоты в крови и длительность охлаждения организма
Дни охлаждения (х) | Молочная кислота, в мг% (у) |
1 | 7,0 |
2 | 7,0 |
3 | 7,2 |
4 | 7,1 |
5 | 8,5 |
6 | 8,9 |
7 | 8,7 |
8 | 9,0 |
9 | 9,5 |
10 | 9,3 |
Задание
На основании исходных данных:
1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);
2) определить направление и силу связи;
3) рассчитать ошибку коэффициента корреляции;
4) рассчитать достоверность коэффициента корреляции.
Задача 2
Исходные данные
Средняя температура сезона и заболеваемость дизентерией
Годы | Средняя температура сезона, С о (х) | Заболеваемость дизентерией в условн. ед. (у) |
2009 | 14,3 | 88 |
2010 | 15,0 | 77 |
2011 | 14,6 | 60 |
2012 | 13,2 | 67 |
2013 | 15,2 | 117 |
2014 | 15,0 | 67 |
2015 | 14,1 | 68 |
2016 | 13,2 | 59 |
2017 | 17,7 | 31 |
2018 | 14,8 | 70 |
2019 | 17,8 | 75 |
Задание
На основании исходных данных:
1) рассчитать коэффициент корреляции по методу квадратов (Пирсона) и методу рангов (Спирмена);
2) определить направление и силу связи;
3) рассчитать ошибку коэффициента корреляции;
4) рассчитать достоверность коэффициента корреляции.
Задача 3
Исходные данные
Уровни систолического и диастолического давления (в мм рт. ст.) у 9 здоровых юношей в возрасте 18 лет
Систолическое давление (х) | Диастолическое давление (у) |
105 | 65 |
115 | 70 |
115 | 65 |
110 | 65 |
110 | 70 |
120 | 75 |
120 | 75 |
120 | 70 |
125 | 75 |