Файл: Медицинская информатика.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 30.11.2023

Просмотров: 460

Скачиваний: 8

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

80 ние критерия

2
. Этот критерий может быть применен, например, при сравне- нии групп, получивших различные сравниваемые по своей активности препара- ты; групп, получивших различные дозы изучаемого препарата или одну и ту же дозу различными путями введения и т.д. Для описания результатов такого ис- следования удобно применять таблицу сопряженности, в которой для каждой из групп указывается число пациентов с каждым из градаций признака. Таким образом, для 2-х рассматриваемых групп и 2-х возможных исходов получается таблица размерности 2х2 (рис. 6.1). Для ответа на вопрос о значимости разли- чий между группами вычисляется величина статистики 
2
, которая является по- казателем максимально возможных при данном уровне значимости отклонений частот.
Критерий 
2
может применяться и к таблице сопряженности произволь- ной размерности.
Точный критерий Фишера основан на переборе всех возможных вари- антах заполнения таблицы сопряженности при данной численности групп. По- зволяет получить точные значения вероятности событий, столь же или еще ме- нее вероятных, чем те, которые наблюдались в действительности.
Критерий Мак-Нимара применяется для анализа связанных измерений в случае измерения реакции для связанной переменной. Является аналогом пара- метрического критерия Стьюдента для зависимых выборок или непараметри- ческого Т-критерий Уилкоксона.
Критерий Кокрена является аналогом непараметрического критерия
Фридмана для случая альтернативного учета реакций. Сравнивается влияние различных воздействий на одну группу (мультиперекрестный план – повторные измерения) или однородные группы (рандомизированный блочный план). Ну- левая гипотеза состоит в том, что в генеральной совокупности доли всех изу- чаемых воздействий одинаковы. Полученное значение статистики Q проверяет- ся по таблицам 
2
для выбранного уровня значимости и числа степеней свобо- ды.
Порядок проведения парных и множественных сравнений качественных признаков представлен на рис. 6.1, 6.2.

81
Рис 6.1. Схема проведения парного сравнения средних значений.
Рис. 6.2. Схема проведения множественного сравнения.
Контрольные вопросы
1. Что такое статистическая гипотеза?
2. Что такое нулевая гипотеза?
3. Что такое альтернативная гипотеза?
4. Что такое ложноположительный и ложноотрицательный результат про- верки статистического теста?
5. Что такое ошибка первого рода?
6. Что такое ошибка второго рода?
7. Что такое мощность критерия?
8. Какие параметрические критерии используются для проверки статисти- ческих гипотез?
9. Какие непараметрические критерии используются для проверки стати- стических гипотез?
10. Приведите примеры статистических критериев, используемых для мно- жественных сравнений средних значений нескольких выборок.
Список литературы
1. Гланц С. Медико-биологическая статистика. Пер. с англ. – М.: Практика,
1998. – 459 с.
2. Лях Ю.Е., Гурьянов В.Г., Хоменко В.Н., Панченко О.А. Основы компью- терной биостатистики: анализ информации в биологии, медицине и фар- мации статистическим пакетом Medstat. – Донецк: 2006. – 214 с.
3. Платонов А.Е. Статистический анализ в медицине и биологии: задача, терминология, логика, компьютерные методы. – М.: Издательство РАМН,
2000. – 52 с.


82 4. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. – М.: МедиаСфера, 2002. –
312 с.
5. Сергиенко В.И., Бондарева И.Б. Математическая статистика в клиниче- ских исследованиях. - М.: ГЭОТАР-МЕД, 2001. – 256 с.

83
1   2   3   4   5   6   7   8   9   ...   16

ТЕМА 7
КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ. ПЛАНИРОВА-
НИЕ КЛИНИЧЕСКИХ ИССЛЕДОВАНИЙ
При изучении общественного здоровья и здравоохранения в научных и практических целях исследователю часто приходится проводить статистиче- ский анализ связей между факторными и результативными признаками стати- стической совокупности (причинно-следственная связь) или определение зави- симости параллельных изменений нескольких признаков этой совокупности от какой либо третьей величины (от их общей причины). Необходимо уметь изу- чать особенности этой связи, определять ее размеры и направление, а также оценивать ее достоверность. С этой целью используется корреляционный и
регрессионный анализ.
Этапы проведения анализа связи переменных.
1. Корреляционный анализ. Его цель – определить характер связи (прямая, обратная) и силу связи (связь отсутствует, связь слабая, умеренная, заметная, сильная, весьма сильная, полная связь). Корреляционный анализ дает информа- цию о характере и степени выраженности связи (по величине коэффициента корреляции), которая используется для отбора существенных факторов, а также для расчета параметров регрессионных уравнений.
2. Расчет параметров и построение регрессионных моделей. Здесь стре- мятся отыскать наиболее точную меру выявленной связи, для того чтобы мож- но было прогнозировать, предсказывать значения зависимой величины Y, если будут известны значения независимых величин X
1
, Х
2
, .... Х
п
3. Выяснение статистической значимость, т.е. пригодности постули- руемой модели для использования ее в целях предсказания значений.
4. Применение статистически значимой модели для прогнозирования
(предсказания), управления или объяснения. Если же обнаружена незначи- мость, то модель отвергают, предполагая, что истинной окажется какая-то дру- гая форма связи, которую надо поискать. Например, с самого начала работы
(как бы по умолчанию) строилась и проверялась линейная регрессионная мо- дель. Незначимость ее служит основанием для того, чтобы отвергнуть только линейную форму модели. Возможно, что более подходящей будет нелинейная форма модели.
Корреляционный анализ. Отличительной чертой биологических объек- тов является многообразие признаков, характеризующих каждый из них. Так, человека можно охарактеризовать возрастом
, ростом, весом, различными фи- зиологическими показателями и т. д. Имея однородную совокупность объектов, можно изучить распределение их по любому из их признаков. Весьма часто можно усмотреть известную связь между вариациями по различным признакам.
Например, вес образцов, сделанных из одного и тoгo же материала, полностью определяется их объемом. Такую зависимость принято называть функциональ-
ной. Для биологических объектов связь обычно бывает менее «жесткой»: объ- екты с одинаковым значением одного признака имеют, как правило, разные значения по другим признакам. Такую связь между вариациями разных призна-

84 ков называют корреляцией (дословный перевод: соотношение) между призна- ками.
Практическое значение установления корреляционной связи – выявление возможной причинно-следственной связи между факторными и результатив- ными признаками (при оценке физического развития, для определения связи между условиями труда, быта и состоянием здоровья, при определении зависи- мости частоты случаев болезни от возраста, стажа, наличия производственных вредностей и др.), а также – выявление зависимости параллельных изменений нескольких признаков от какой-то третьей величины (например, под воздейст- вием высокой температуры в цехе происходят изменения кровяного давления, вязкости крови, частоты пульса и др).
Стандартный способ выявления взаимосвязи нескольких переменных, измеряемых в порядковой или интервальной шкалах, – подсчет коэффициента
корреляции. Коэффициент корреляции одним числом измеряет силу связи меж- ду изучаемыми явлениями и дает представление о ее направленности. По на- правлению связь может быть прямой или обратной. По силе связи коэффициен- ты корреляции колеблются от 1 (полная связь) до 0 (отсутствие связи). Коэф- фициент корреляции может иметь значение от –1 до +1, т.е. иметь отрицатель- ное либо положительное значение. В этих случаях говорят об обратной или прямой корреляционной взаимосвязи. Величина коэффициента характеризует силу корреляционной взаимосвязи.
Чем ближе модуль коэффициента корреляции к единице, тем сильнее
или глубже корреляционная взаимосвязь между двумя вариационными ря-
дами. Модульное значение выше 0,8 характеризуют сильную взаимосвязь, в
интервале 0,8-0,5 – выраженную взаимосвязь, 0,5-0,2 – слабую взаимосвязь,
менее 0,2 (0,2 – 0) – отсутствие взаимосвязи(рис. 7.1).
Рис. 7.1. Схема оценки силы корреляционной связи по величине коэффициента
корреляции.
Коэффициент корреляции для нормально распределенных наблюдений
(коэффициент корреляции Пирсона) рассчитывается по формуле (7.1):
2 2
y
x
y
x
XY
d
d
d
d
r




, (7.1)


85 где
X
и
Y
– варианты сопоставляемых вариационных рядов,
X
d
и
Y
d

отклонение каждой варианты от своей средней арифметической (
X
M
и
Y
M
).
В случае работы с данными, распределение которых отлично от нормаль- ного, необходимо пользоваться ранговыми методами – вычислять коэффициент корреляции Кендалла (для порядковых переменных) или, лучше, коэффициент корреляции Спирмена (непараметрический аналог коэффициента Пирсона для интервальных и порядковых переменных). Коэффициент Пирсона равен едини- це (или минус единице) тогда и только тогда, когда две переменные (х и у) свя- заны линейной зависимостью (
b
ax
y


). Коэффициент Спирмена (или Кен- далла) равен 1, если две переменные связаны правилом: большему значению переменной х всегда соответствует большее значение переменной у. Чем ниже коэффициент корреляции, тем сильнее отклонение от этих правил.
Коэффициент ранговой корреляции Кендалла
Применяется для выявления взаимосвязи между количественными или качественными показателями, если их можно ранжировать. Значения показате- ля X выставляют в порядке возрастания и присваивают им ранги. Ранжируют значения показателя Y и рассчитывают коэффициент корреляции Кендалла
(7.2):
)
1
(
2


n
n
S

(7.2) где
Q
P
S


, P – суммарное число наблюдений, следующих за текущими наблюдениями с большим значением рангов Y,
Q – суммарное число наблюдений, следующих за текущими наблюдения- ми с меньшим значением рангов Y (равные ранги не учитываются).
Коэффициент ранговой корреляции Спирмена
Каждому показателю X и Y присваивается ранг. На основе полученных рангов рассчитываются их разности d и вычисляется коэффициент корреляции
Спирмена (7.3):
)
1
(
6 1
2 2




n
n
d

(7.3)
Положительная корреляционная взаимосвязь между двумя вариационны- ми рядами
X
и
Y
свидетельствует о том, что величина
X
прямо зависит от величины
Y
, отрицательная говорит об обратной зависимости.
Важно отметить, что установление корреляции между признаками само по себе еще не дает оснований делать какие-либо заключения о причинно- следственных связях между ними. В случае несгруппированной совокупности может быть получено наглядное представление о наличии или отсутствии кор- реляции путем построения так называемого корреляционного поля (рис. 7.2).
Вытянутость корреляционного поля в диагональном направлении свидетельст- вует о наличии корреляции между обоими признаками. Если число вариант ве- лико, то корреляционное поле часто имеет вид более или менее правильного эллипса со сгущением точек в центре и сравнительно редким их расположени-