Файл: Методы статистического анализа Модуль Организация (этапы) медикосоциального исследования Цель изучения модуля.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.12.2023

Просмотров: 368

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

71 3. Значение 1% прироста;
4. Абсолютный прирост;
5. Темп роста.
8. НАЗОВИТЕ ВИДЫ АБСОЛЮТНОГО ПРИРОСТА
1. Базисные, абсолютные;
2. Абсолютные, относительные;
3. Базисные, цепные
4. Относительные, средние;
5. Средние, цепные.
9. ПО ФОРМУЛЕ
=
%
Т
пp p
Τ %-100% ОПРЕЛЯЕТСЯ:
1. Темп роста;
2. Абсолютный прирост;
3. Значение 1% прироста
4. Средний темп прироста;
5.
Темп прироста.
10. ПО ФОРМУЛЕ
100 1

=
i
i
y
Α
ОПРЕДЕЛЯЕТСЯ
1. Коэффициент опережения;
2. Пункт роста;
3. Средний темп прироста;
4. Абсолютное значение 1% прироста;
5. Темп роста.
7.6. Задачи для самостоятельного решения
Задача 1
Исходные данные: по некоторому субъекту РФ имеются данные о коэффициентах смертности населения за 2008 – 2015 гг., представленные в таблице 7.5.
Таблица 7.5. Временной ряд коэффициента смертности населения некоторого субъекта РФ за 2008-2015 гг.
Название показателя
2008 2009 2010 2011 2012 2013 2014 2015
Смертность,
00 0
15,3 15,6 16,2 16,4 16,0 16,1 15,2 14,6
Уровни ряда
y
0
y
1
y
2
y
3
y
4
y
5
y
6
y
7
Задача 2
Исходные данные: по некоторому субъекту РФ имеются данные о коэффициентах рождаемости за 2008 – 2015 гг., представленные в таблице 7.6.
Таблица 7.6. Временной ряд коэффициента рождаемости некоторого субъекта РФ за 2008-
2015 гг.
Название показателя
2008 2009 2010 2011 2012 2013 2014 2015
Рождаемость,
00 0
12,1 12,4 12,6 12,9 13,4 13,2 13,4 13,7
Уровни ряда
y
0
y
1
y
2
y
3
y
4
y
5
y
6
y
7
Задача 3

72
Исходные данные: по некоторому субъекту РФ имеются данные о коэффициентах перинатальной смертности за 2008 – 2015 гг., представленные в таблице 7.7.
Таблица 7.7. Временной ряд коэффициента перинатальной смертности некоторого субъекта РФ за 2008-2015 гг.
Название показателя
2008 2009 2010 2011 2012 2013 2014 2015
Перинатальная смертность,
00 0
13,2 12,8 12,1 11,3 10,6 10,2 9,6 9,1
Уровни ряда
y
0
y
1
y
2
y
3
y
4
y
5
y
6
y
7
Задание
На основе данных временных рядов, представленных в задачах 1, 2, 3, рассчитать и проанализировать следующие показатели:
• абсолютный прирост;
• темп роста;
• темп прироста;
• абсолютное значение 1% прироста.
7.7. Рекомендуемая литература
1. Андерсон Т. Статистический анализ временных рядов: пер. с англ. – М.: Мир, 1976. –
755 с.
2. Медик В.А.
Общественное здоровье и здравоохранение: учебник. – 3-е изд., испр. и доп. – М.: ГЭОТАР-Медиа, 2017.
3. Медик В.А., Токмачев М.С. Математическая статистика в медицине: учеб. пособие –
М.: Финансы и статистика, 2007. – С. 457-459.


73
Модуль 8. Анализ зависимостей статистических показателей
Цель изучения модуля: показать значение зависимостей между статистическими показателями для изучения общественного здоровья, деятельности системы (организаций) здравоохранения и в клинической практике.
После изучения темы студент должен знать:
➢ типы зависимостей между статистическими показателями;
➢ непараметрические методы оценки корреляционной зависимости;
➢ методику расчета, анализа и интерпретации выявленных зависимостей между статистическими показателями.
Студент должен уметь:
➢ установить тип зависимости между статистическими показателями;
➢ выбрать тот или иной тип зависимости между статистическими показателями при анализе общественного здоровья и деятельности системы (организаций) здравоохранения;
➢ рассчитать выборочный коэффициент корреляции;
➢ провести оценку корреляционной зависимости с помощью непараметрических методов;
➢ использовать полученные знания при обучении на клинических кафедрах.
8.1 Блок информации
Типы зависимостей. Многие прикладные задачи, например изучение причинно-следственных связей факторов риска и заболеваемости населения, требуют установления вида зависимости между показателями, которые выступают как случайные величины. Сама постановка множества задач в различных медико-социальных исследованиях предполагает построение и реализацию алгоритмов «фактор - отклик», «доза - эффект».
Случайные величины X и Y могут быть либо независимыми, либо зависимыми.

74
Зависимость случайных величин называют
стохастической
(статистической), если изменение одной из них приводит к изменению закона распределения другой. Если изменение одной из случайных величин влечет изменение другой случайной величины, то стохастическую зависимость называют корреляционной (например, зависимость заболеваемости населения от воздействия внешних факторов - эколого-гигиенических (климатические факторы, содержание различных соединений в атмосферном воздухе, воде, почве, пищевых продуктах), медико-организационных
(уровень диспансеризации населения, обеспеченность больничными койками, медицинским персоналом) и т.д. Сами случайные величины, связанные корреляционной зависимостью, оказываются коррелированными. При корреляционной зависимости Y и X возможно наблюдать тенденцию роста: с увеличением значений Х среднее значение Y возрастает или с увеличением значений Х среднее значение Y уменьшается. В этих случаях говорят соответственно о положительнойилиотрицательной корреляции.
Выборочный коэффициент корреляции. Как известно, степень зависимости случайных величин Х и Y (двух признаков) характеризуется значением коэффициента корреляции Пирсона:
)
(
)
(
)
(
Υ
D
Χ
D
Χ,Υ
Κ
r
r
xy
=
=
, где K(X,Y) - корреляционный момент (ковариация) случайных величин X и Y,
D(Х) и D(Y) – дисперсии случайных величин.
Отметим, что всегда -1≤ r ≤ 1. Чем больше значение r отличается от нуля, тем сильнее зависимость X и Y. Если
r
= 1, то случайные величины X и Y
связаны линейной функциональной зависимостью, Y=aХ+b, причем при r = -
1 коэффициент a<0 (зависимость X и Y обратная), а при r = 1 коэффициент a>0
(зависимость X и Y прямая).
При этом коэффициент корреляции Пирсона, как и всякая другая теоретическая характеристика, вычисляется, исходя из всех возможных значений Х и Y. На практике мы не имеем возможности охватить


75 наблюдениями все указанное множество, а используем лишь ограниченное число наблюдений: двумерную выборку
1
значений (x, y). Полученные числа можно занести в таблицу.
Таблица 8.1. Запись двумерной выборки
X
1
x
2
x

x
n
Y
1
y
2
y

y
n
По данным наблюдений можно вычислить значение коэффициента корреляции так же, как и в случае системы дискретных случайных величин, с той лишь разницей, что вместо известных вероятностей для каждой пары возможных значений будем использовать соответствующий аналог: относительную частоту
n
1 . Формула для вычисления выборочного коэффициента корреляции генеральных совокупностей (случайных величин)
X и Y, исходя их двумерной выборки, выглядит так:



=
=
=





=
n
i
n
j
j
i
n
i
i
i
y
y
x
x
y
y
x
x
r
1 1
2 2
1
B
)
(
)
(
)
)(
(
Если наблюдения объединяются по интервалам, т.е. все значения, попавшие в интервал, округляются до значения середины интервала, то каждая из наблюдаемых пар значений может встретиться неоднократно. В этом случае обычно данные заносят в таблицу с учетом частот встречаемости.
Такую таблицу сгруппированных данных называют корреляционной.
Выборочный коэффициент корреляции
B
r
– оценка коэффициента корреляции r, рассчитанного по всей генеральной совокупности, т.е.
B
r
r
Следовательно, рассчитав
B
r
, можно судить о силе линейной связи. В случае если выборка имеет достаточно большой объем n, порядка сотен, то
1
Отметим, что в случае двумерной выборки значения случайных величин Х и Y располагаются не произвольно, а в соответствии с номером испытания i, т.е. каждому
i
x однозначно соответствует
i
y .

76 целесообразно воспользоваться
B
r
как точечной оценкой коэффициента корреляции r.
0>
1   2   3   4   5   6   7   8

Непараметрические методы оценки корреляционной зависимости.
Приведем ряд характеристик, оценивающих тесноту связи различных факторов (признаков), причем не только количественных, но и качественных.
В простейшем случае это признаки, представленные двумя альтернативными исходами типа "да - нет", "жив - умер", "заболел - не заболел" и т.д. Показатели тесноты связи вычисляются с использованием таблиц сопряженности.
Таблица 8.2. Таблица сопряженности признаков
2-й признак
1-й признак
Да
Нет
Всего
Да
Нет
a
с
b
d
a + b
c + d
Всего
a + c
b + d
n = a + b + c + d
Для характеристики тесноты связи между признаками используются коэффициент ассоциации Юла и коэффициент контингенции Пирсона.
Коэффициент ассоциации Юла K
а
в соответствии с приведенной таблицей рассчитывают по формуле:
bc
ad
bc
ad
Κ
a
+

=
Коэффициент ассоциации K
а
может принимать значения от -1 до +1. В случаях K
а
= 1 теснота связи между признаками считается наиболее сильной, причем так же, как и для коэффициента корреляции, положительный или отрицательный знак K
а
свидетельствует о прямой или соответственно обратной зависимости значений признаков.
Коэффициент контингенции Пирсона K
k
рассчитывается по формуле:
(
)(
)(
)(
)
d
b
c
a
d
c
b
a
bc
ad
Κ
k
+
+
+
+

=
Коэффициент контингенции также изменяется от -1 до +1, но его значения всегда (за исключением граничных случаев K
k
= 1) несколько меньше

77 значений коэффициента ассоциации. Эта характеристика имеет тот же смысл, что и K
а
Для качественной оценки силы связи при использовании коэффициента ассоциации Юла и коэффициента контингенции Пирсона можно руководствоваться шкалой Чеддока.
Таблица 8.3. Шкала Чеддока
Коэффициент
0,1 –
0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Характеристи
ка
зависимости
слабая умеренна я заметная высокая весьма высокая
В случае, когда каждый из двух качественных признаков содержит более двух групп значений, тесноту связи признаков измеряют с помощью
коэффициента взаимной сопряженности, которыйрассчитывается по специальным формулам.
8.2. Задания для самостоятельной работы
1. Изучить материалы соответствующего модуля, рекомендуемой литературы.
2. Ответить на контрольные вопросы.
3. Разобрать задачу-эталон.
4. Ответить на вопросы тестового задания модуля.
5. Решить задачи для самостоятельного решения.
8.3. Контрольные вопросы
1. Дайте определение корреляционной зависимости. Приведите примеры.
2. Опишите методику вычисления выборочного коэффициента корреляции.
3. Какая связь между выборочным коэффициентом корреляции и коэффициентом корреляции генеральной совокупности?
4. Какова структура таблицы сопряженности признаков?
5. Для изучения каких признаков используют коэффициент ассоциации Юла и коэффициент контингенции Пирсона? О чем свидетельствуют отрицательные и положительные значения этих коэффициентов?
6. Для чего используют шкалу Чеддока?
8.4. Задача-эталон


78
Исходные данные
1. При изучении общественного здоровья населения некоторого субъекта РФ возникла необходимость провести анализ зависимости показателя смертности от возраста и пола.
Исходные статистические данные представлены в таблице 8.4.
Таблица 8.4. Возрастно-половые статистические показатели смертности населения (на
1000 населения соответствующего пола и возраста)
Возраст
0
-4 5
-9 10
-14 15
-19 20
-24 25
-29 30
-34 35
-39 40
-44 45
-49 50
-54 55
-59 60
-64 65
-69 70 ле т и б оле е
Мужчины,
i
x
3,9 0,7 0,5 2,4 5,3 7,7 11,0 16,6 21,2 27,9 37,4 46,6 65,5 73,7 117,5
Женщины,
i
y
2,3 0,3 0,3 0,8 1,2 2,0 2,4 4,1 5,7 7,8 11,7 14,7 21,7 26,4 84,7
2. Для углубленного изучения смертности от туберкулеза в зависимости от пола больных потребовалось выявить возможную связь между полом больных и исходом заболевания. Были взяты две группы больных туберкулезом органов дыхания: мужчины и женщины. В первой группе (мужчины) из 221 заболевшего 68 умерли. Во второй группе
(женщины) из 194 заболевшей 83 умерли. Полученные данные представлены в таблице 8.5.
Таблица 8.5. Распределение больных туберкулезом по полу и исходу заболевания
(абсолютные числа)
1-й признак (пол)
2-й признак (исход)
Всего
живы
умерли
Мужчины
153 (а)
68 (b)
221 (a+b)
Женщины
111 (c)
83 (d)
194 (c+d)
Всего
264 (a+c)
151 (b+d)
415 (a+b+c+d)
Задание
На основании исходных данных, представленных в таблицах:
1. Оценить степень зависимости показателя смертности в группах мужчин и женщин с помощью коэффициента корреляции;
2. Оценить корреляционную зависимость между признаками "пол" и "исход" с использованием непараметрических методов (коэффициента ассоциации Юла и коэффициента контингенции Пирсона).
Решение
1. Расчет выборочного коэффициента корреляции
Для удобства вычислений поместим значения в таблицу и представим результаты вычислений.
Таблица 8.6. Расчетная таблица к задаче 1.
i
x
i
y
i
x
x
i

2
)
(
x
x
i

y
y
i

2
)
(
y
y
i

)
)(
(
y
y
x
x
i
i


1 3,9 2,3
-25,29 639,58
-10,11 102,21 255,68 2
0,7 0,3
-28,49 811,68
-12,11 146,65 345,01 3
0,5 0,3
-28,69 823,12
-12,11 146,65 347,44 4
2,4 0,8
-26,79 717,70
-11,61 134,79 311,03 5
5,3 1,2
-23,89 570,73
-11,21 125,66 267,81 6
7,7 2
-21,49 461,82
-10,41 108,37 223,71

79 7
11 2,4
-18,19 330,88
-10,01 100,20 182,08 8
16,6 4,1
-12,59 158,51
-8,31 69,06 104,62 9
21,2 5,7
-7,99 63,84
-6,71 45,02 53,61 10 27,9 7,8
-1,29 1,66
-4,61 21,25 5,95 11 37,4 11,7 8,21 67,40
-0,71 0,50
-5,83 12 46,6 14,7 17,41 303,11 2,29 5,24 39,87 13 65,5 21,7 36,31 1318,42 9,29 86,30 337,32 14 73,7 26,4 44,51 1981,14 13,99 195,72 622,69 15 117,5 84,7 88,31 7798,66 72,29 5225,84 6383,93 9
,
437
=

=
x
29,19 1
,
186
=

=
y
12,41
=
 16048,25
=
 6513,49
=
 9474,93
Все значения из таблицы переносим в формулу расчета выборочного коэффициента корреляции:



=
=
=





=
n
i
n
j
j
i
n
i
i
i
y
y
x
x
y
y
x
x
r
1 1
2 2
1
B
)
(
)
(
)
)(
(
927
,
0 49
,
6513 25
,
16048 93
,
9474


=
2. Оценка
корреляционной зависимости непараметрическими методами
2.1. Расчет коэффициента ассоциации Юла - K
а
254
,
0 111 68 83 153 111 68 83 153
=

+




=
+

=
bc
ad
bc
ad
K
a
2.2. Расчет коэффициента контингенции Пирсона – K
k
(
)(
)(
)(
)
125
,
0 151 264 194 221 111 68 83 153
=






=
+
+
+
+

=
d
b
c
a
d
c
b
a
bc
ad
K
k
Вывод
1. Оценка значения коэффициента корреляции по шкале Чеддока – 0,927 свидетельствует о прямой достаточно высокой зависимости коэффициента смертности в группах мужского и женского населения.
2. Хотя значения коэффициентов K
а
и K
k
отличаются друг от друга, согласно шкале
Чеддока, качественная характеристика тесноты связи одна и та же: сила связи слабая.
Логически эта характеристика вполне закономерна, так как в нашем примере градация "мужчина - женщина" не является определяющей для второго признака "живы - умерли", а лишь оказывает некоторое влияние, а величину этого влияния и представляют вычисляемые по разным формулам коэффициент ассоциации и коэффициент контингенции.
8.5. Тестовые задания
Выберите только один правильный ответ.