Файл: Книга Primer of biostatistics fourth edition.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.12.2023

Просмотров: 574

Скачиваний: 7

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Рис. 9.4. Разложение вариации и числа степеней свободы при дисперсионном анализе.
Таблица 9.3. Таблица дисперсионного анализа для эксперимента с 4 диетами
Число степеней
Вариация свободы
Дисперсия
Межгрупповая
0,685 3
0,228
Внутригрупповая 3,825 24 0,159
Общая
4,51 27
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ
меж меж вну вну
0,228 1,4 0,159
S
F
S
ν
=
=
=
ν

304
Рис. 9.5. Разложение вариации и числа степеней свободы при дисперсионном анализе повторных измерений.
ГЛАВА 9

305
Оба разложения изображены на рис. 9.4. Перечисленные ве- личины обычно включают в таблицы дисперсионного анализа
наподобие табл. 9.3.
Теперь, наконец, мы располагаем средствами, необходимы- ми в дисперсионном анализе повторных измерений.
ДИСПЕРСИОННЫЙ АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ
До сих пор мы имели дело с несколькими группами больных,
которые подвергались различным методам лечения. В
дисперсионном анализе повторных измерений ситуация иная:
одни и те же больные последовательно подвергаются несколь-
ким методам лечения или просто наблюдаются в несколько пос- ледовательных моментов времени. По-другому распределяется и общая вариация S
общ
(рис. 9.5). Прежде всего можно выделить- межиндивидуальную (S
МИ
) и внутрииндивидуальную (S
ВИ
) ва- риацию, последняя, в свою очередь, распадается на обусловлен- ную методом лечения (S
ле
) и остаточную (S
ост
), обусловленную случайными колебаниями, ошибкой измерения и т. п.
Обозначения, которые мы будем использовать в дисперсион- ном анализе повторных измерений, приведены в табл. 9.4. Пред- ставлены 4 больных, каждого из которых последовательно ле- чили 3 методами. Значения интересующего нас признака обо-
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ
Таблица 9.4. Обозначения, используемые в дисперсионном ана- лизе повторных измерений
Метод лечения
Среднее
Вариация
Больной
1 2
3
б
X
S
ВИб
1
X
11
Х
21
Х
31 1
X
(
)
2
м1 1
м
X
X


2
Х
12
Х
22
Х
32 2
X
(
)
2
м2 2
м
X
X


3
Х
13
Х
23
X
33 3
X
(
)
2
м3 3
м
X
X


4
Х
14
Х
24
Х
34 4
X
(
)
2
м4 4
м
X
X


Среднее
1
T
2
T
3
T

306
значены Х
мб
, например, Х
12
значение у 2-го больного при 1-м методе лечения, Х
31
значение у 1-го больного при 3-м методе лечения и так далее. Величины б
X
(
1
X
,
2
X
,
3
X
и
4
X
) — это
«индивидуальные» средние (средние значения признака при всех методах лечения у 1-го, 2-го и т. д. больного):
мб м
б
,
X
X
m
=

где т — число методов лечения. м
T
(
1
T
,
2
T
,
3
T
и
4
T
)средние значения признака у всех больных при 1-м, 2-м и т. д. методе лечения:
мб б
м
,
X
T
n
=

где п — число больных.
Общая вариация — это сумма квадратов отклонений всех зна- чений (у всех больных при всех методах лечения) от общего среднего, которое составляет мб м
б
;
X
X
mn
=
∑∑
таким образом,
(
)
2
общ мб м
б
S
X
X
=

∑∑
Соответствующее число степеней свободы
ν
общ
= тп – 1.
Общая вариация складывается из межиндивидуальной и внутрииндивидуальной вариации. Рассчитаем внутрииндивиду- альную вариацию S
ВИ
. У первого больного сумма квадратов от- клонений от индивидуального среднего
1
X равна
(
)
1 2
ВИ
м1 1
м
S
X
X
=


У второго больного
(
)
2 2
ВИ
м2 2
м
S
X
X
=


ГЛАВА 9


307
и так далее. Чтобы рассчитать внутрииндивидуальную вариа- цию, просуммируем б
ВИ
S по всем больным:
(
)
1 2
3 4
2
ВИ
ВИ
ВИ
ВИ
ВИ
мб б
б м
S
S
S
S
S
X
X
=
+
+
+
=

∑∑
Соответствующее число степеней свободы составляет
ν
ВИ
=
= n(m – 1).
Перейдем к межиндивидуальной вариации. Она складывается из квадратов отклонений индивидуальных средних б
X
от об- щего среднего
X
:
(
)
2
МИ
б
S
m
X
X
=


Множитель т появляется из-за того, что каждое б
X
это среднее по т методам лечения. Число степеней свободы
ν
МИ
=
= n – 1.
Можно показать*, что общая вариация равна сумме внутри- и межиндивидуальной вариаций:
общ
ВИ
МИ
S
S
S
=
+
Теперь из внутрииндивидуальной вариации нам предстоит выделить вариацию, связанную с лечением S
ле
, и остаточную вариацию S
ост
, связанную со случайными отклонениями и ошиб- ками измерения. Вариация, связанная с лечением, складывает- ся из квадратов отклонений средних по методам лечения м
T
от общего среднего
X
:
(
)
2
ле м
S
n
T
X
=


Наличие коэффициента п связано с тем, что каждое Т
м
это среднее по п больным.
Соответствующее число степеней свободы
ν
ле
= m – 1.
Остаточная вариация — вторая составляющая внутриинди- видуальной вариации — получается вычитанием:
ост
ВИ
ле
S
S
S
=

* Вывод этого равенства см. в: В. J. Winer, D. R. Brown, К. М. Michels.
Statistical principles in experimental design, 3d ed. McGraw-Hill, New York,
1991.
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ

308
Аналогично вычисляется и остаточное число степеней свобо- ды
ν
ост
:
ν
ост
=
ν
ВИ

ν
ле
= n(m –1) – (m – 1) = (n – 1)(m – 1).
Теперь мы можем получить две независимые оценки диспер- сии: на основании вариации, связанной с лечением
2
ле ле ле
,
S
s
=
ν
и на основании остаточной вариации:
2
ост ост ост
,
S
s
=
ν
после чего можно применить знакомый нам критерий F:
2
ле
2
ост
s
F
s
=
Далее следует поступить как при обычном дисперсионном анализе. Вычисленное значение F сравнивают с критическим для выбранного уровня значимости и числа степеней свободы.
Чтобы воспользоваться табл. 3.1, нужно в качестве
ν
меж взять
ν
ле
, а в качестве
ν
вну
— соответственно
ν
ост
Боюсь, читателя утомили сложные выкладки и громоздкие термины, которыми несколько перегружен этот раздел. Пора пе- рейти к практическим применениям. Как мы уже говорили, дис- персионный анализ повторных наблюдений можно использо- вать не только когда к одним и тем же больным применяется несколько методов лечения, но и когда больные просто наблюда- ются в несколько разных моментов времени. Именно на таком,
очень простом примере мы и рассмотрим применение дисперси- онного анализа повторных измерений.
Гидралазин при первичной легочной гипертензии
Первичная легочная гипертезия — редкое и чрезвычайно тяже- лое заболевание, при котором вследствие неизвестных причин повышается давление в артериях легких. Стенки артерий утол-
ГЛАВА 9


309
щаются, что затрудняет газообмен в легких. Из-за повышенной нагрузки на правый желудочек страдает сердце. Без лечения больные живут не более нескольких лет. Гидралазин — препа- рат, расширяющий сосуды, — успешно используется при гипертонической болезни. Л. Рубин и Р. Питер* предположили,
что его можно использовать и при первичной легочной гипер- тензии. В исследование вошли 4 больных. Измерения произво- дили трижды: перед началом лечения, спустя 48 ч и 3—6 мес лечения. (В дальнейшем мы будем говорить просто о 1,2 и 3-м измерениях.) Измеряли, в частности, легочное сосудистое со- противление. Этот показатель отражает тяжесть легочной ги- пертензии: чем выше сопротивление, тем тяжелее гипертензия.
Результаты представлены на рис. 9.6. Похоже, данные говорят в пользу препарата. С другой стороны, они получены на мало- численной выборке. Поэтому не будем доверяться впечатлени- ям, а воспользуемся дисперсионным анализом повторных из- мерений.
Обратимся к табл. 9.5. Здесь помимо первичных данных при- ведены средние значения легочного сосудистого сопротивления для каждого из 4 больных и для каждого из трех моментов изме- рения. Например, у второго больного среднее легочное сосуди- стое сопротивление составило
2 17,0 6,3 6,2 9,83,
3
X
+
+
=
=
а среднее легочное сосудистое сопротивление при 1-м измере- нии:
1 22,2 17,0 14,1 17,0 17,58.
3
T
+
+
+
=
=
Среднее сопротивление по всем измерениям
X
= 11,63, а об- щая вариация S
общ
= 289,82.
В табл. 9.5 приведены также суммы квадратов отклонений от индивидуального среднего. Например, для второго больного
2
ВИ
S
= (17,0 – 9,83)
2
+ (6,3 – 9,83)
2
+ (6,2 – 9,83)
2
= 77,05.
* L. J. Rubin and R. H. Peter. Oral hydralazine therapy for primary pulmonary hypertension. N. Engl. J. Med., 302:69—73, 1980.
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ

310
Внутрииндивидуальная вариация составляет
S
ВИ
= 147,95 + 77,05 + 18,35 + 21,45 = 264,80.
Можно найти межиндивидуальную вариацию
S
МИ
= 3[(12,73 – 11,63)
2
+ (9,83 – 11,63)
2
+
+ (10,63 – 11,63)
2
+ (13,33 – 11,63)
2
] = 25,02.
Заметьте, что, как это и должно быть, выполняется равенство
S
общ
= S
ВИ
+ S
МИ
Рассчитаем S
ле
(теперь эта вариация связана со временем, но мы оставим прежнее обозначение):
S
ле
= 4[(17,58 – 11,63)
2
+ (7,73 – 11,63)
2
+ (9,60 – 11,63)
2
] = 218,93.
Соответствующее число степеней свободы:
Рис. 9.6. Изменение легочного сосудистого сопротивления у 4 больных с легочной ги- пертензией при лечении гидралазином.
ГЛАВА 9

311
ν
ле
= m – 1 = 3 – 1 = 2.
Наконец, остаточная вариация определяется равенством
S
ост
= S
ВИ
– S
ле
= 264,80 – 218,93 = 45,87
и имеет
ν
ост
= (n – 1)(m – 1) = (4 – 1)(3 – 1) = 6 степеней свободы.
Все найденные величины сведены в табл. 9.6. Обратите вни- мание, что здесь общая вариация разложена на большее число составляющих, чем в табл. 9.3. Причина в том, что теперь рас- сматриваются результаты повторных измерений одной группы,
а не однократных измерений нескольких групп.
Вычисляем оценку дисперсии на основании вариации, обу- словленной лечением:
2
ле ле ле
218,93 109,47 2
S
s
=
=
=
ν
и на основании остаточной вариации:
2
ост ост ост
45,87 7,65.
6
S
s
=
=
=
ν
Теперь, наконец, можно вычислить F:
2
ле
2
ост
14,31.
s
F
s
=
=
Критическое значение для числа степеней свободы
ν
меж
= 2 и
Таблица 9.5. Легочное сосудистое сопротивление у больных пер- вичной легочной гипертензией на фоне лечения гидралазином
Измерение
Больной 1 2
3
Среднее
Вариация
1 22,2 5,4 10,6 12,73 147,95 2
17,0 6,3 6,2 9,83 77,05 3
14,1 8,5 9,3 10,63 18,35 4
17,0 10,7 12,3 13,33 21,45
Среднее 17,58 7,73 9,60
Общее среднее X = 11,63. Общая вариация S
общ
= 289,82.
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ


312
ν
вну
= 6 составляет 10,92, то есть меньше полученного нами. Та- ким образом, легочное сосудистое сопротивление нельзя счи- тать постоянным. По крайней мере в один из моментов легоч- ное сосудистое сопротивление значимо отличается от наблюда- емого в остальные моменты. Ответить на вопрос, что это за момент и что это за отличия, дисперсионный анализ не может.
Для этого следует воспользоваться методами множественных сравнений (гл.4).
Как выявить различия в повторных измерениях
В гл. 4 мы познакомились с критерием Стьюдента с поправкой
Бонферрони. Он вычисляется как обычный критерий Стьюдента:
2 2
i
j
X
X
t
s
n

=
Однако уровень значимости в каждом из сравнений, соглас- но поправке Бонферрони, принимается равным
α = α′/k, где α′ —
истинный уровень значимости (по всем сравнениям в целом), а
k — число сравнений. Критерий Стьюдента с поправкой Бон- феррони, как и другие методы множественного сравнения, при- меняется лишь после того, как дисперсионный анализ обнару- жит сам факт существования различий.
Таблица 9.6. Таблица дисперсионного анализа (исследование гидралазина при первичной легочной гипертензии)
Число степеней
Оценка
Вариация свободы дисперсии
Межиндивидуальная S
МИ
= 25,02 3
Внутрииндивидуальная S
ВИ
= 264,80 8
обусловленная лечением S
ле
= 218,93 2 109,47
остаточная S
ост
= 45,87 6
7,65
Общая S
общ
= 289,82 11 2
ле
2
ост
14,31
s
F
s
=
=
ГЛАВА 9

313
При дисперсионном анализе повторных измерений схема ис- пользования критерия остается прежней. Отличие в том, что в формуле для t вместо s
2
следует взять остаточную дисперсию
2
ост
s , а средние по группам заменить на средние по методам ле- чения (моментам наблюдения) м
T . Тогда формула для t примет вид:
2
ост
2
i
j
T T
t
s
n

=
Полученное значение нужно сравнить с критическим зна- чением для распределения Стьюдента при
ν
ост степенях свобо- ды.
Вернемся к эксперименту с гидралазином. Остаточная оцен- ка дисперсии
2
ост
s = 7,65. Число больных при каждом измерении
n = 4.
Сравним 1-е и 2-е измерения:
17,58 7,73 5,036.
2 7,65 4
t

=
=
×
Сравним 1-е и 3-е измерения:
17,58 9,60 4,080.
2 7,65 4
t

=
=
×
И наконец, 2-е и 3-е измерения:
7,73 9,60 0,9561.
2 7,65 4
t

=
= −
×
Чтобы вероятность ошибочно обнаружить различие была в совокупности по всем трем сравнениям меньше 0,05, нужно в каждом отдельном сравнении использовать в три раза меньший уровень значимости 0,05/3 = 0,016. Для этого уровня значимости
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ


314
и при числе степеней свободы
ν = 6 находим по табл. 4.1 кри- тическое значение, приближенно равное 3,37 (поскольку табли- ца не содержит значений для
α = 0,016, оно расчитывается приблизительно по соседним значениям
α = 0,01 и α = 0,02).
Значения t для первых двух сравнений больше критического,
а для третьего — меньше. Поэтому при уровне значимости 0,05
(но ни в коем случае не 0,016, используемом в каждом сравне- нии) различие в величине общего легочного сопротивления до и после приема гидралазина статистически значимо, а между из- мерениями на фоне приема гидралазина статистически незначимо.
Заканчивая обсуждение парных сравнений, скажем, что вме- сто поправки Бонферрони можно воспользоваться более точным критерием Ньюмена—Кейлса или критерием Тыоки. Кроме того,
в рассматриваемом примере, где измерения, выполненные до начала лечения, играют роль «контрольной группы», пригоден и критерий Даннета для множественного сравнения с контро- льной группой. Все эти критерии описаны в гл. 4. При их при- менении нужно, как и в случае критерия Стьюдента с поправкой
Бонферрони, в качестве оценки дисперсии брать
2
ост
s
, а при на- хождении критического значения использовать число степеней свободы остаточной вариации.
Чувствительность дисперсионного анализа повторных
измерений
Чувствительность вычисляется так же, как в обычном дисперси- онном анализе, с той разницей, что в качестве оценки для s ис- пользуется s
ост
, а вместо численности отдельных групп — чис- ленность единственной рассматриваемой группы.
КАЧЕСТВЕННЫЕ ПРИЗНАКИ: КРИТЕРИЙ МАК-НИМАРА
Парный критерий Стьюдента и дисперсионный анализ повтор- ных измерений применимы, только если зависимый признак яв- ляется числовым и, сверх того, подчиняется нормальному зако- ну распределения. Как быть, если признак качественный, то есть имеет своими значениями не числа, а «названия» (с такими при-
ГЛАВА 9

315
знаками мы познакомились в гл. 5). Они часто встречаются в медицине. Например, диагноз — типичный качественный при- знак. Сейчас мы познакомимся с критерием Мак-Нимара. Он предназначен для анализа повторных измерений качественных признаков и в некотором смысле является аналогом парного критерия Стьюдента. Знакомство с новым критерием мы нач- нем с примера.
Проба с динитрохлорбензолом при онкологических
заболеваниях
Ослабление иммунитета повышает риск онкологических забо- леваний. Считается также, что при уже развившемся злокачест- венном новообразовании ослабление иммунитета — плохой прогностический признак и наоборот — сохранность иммуни- тета говорит о высокой вероятности успеха лечения. Для оцен- ки состояния иммунитета применяется кожная проба с динитро- хлорбензолом. Проба считается положительной, если через 48
часов после нанесения динитрохлорбензола на кожу развивает- ся выраженная воспалительная реакция. Положительная проба говорит о сохранности иммунитета.
Ряд авторов оспаривают значение пробы, указывая, в част- ности, на то, что воспалительная реакции может быть вызвана местнораздражающим действием динитрохлорбензола и не от- ражает состояния иммунитета.
Чтобы выяснить этот вопрос, Рот и соавт.* проделали сле- дующий опыт. На кожу больных наносили динитрохлорбензол и одновременно — на соседний участок кожи — кротоновое масло. Кротоновое масло оказывает местнораздражающее дей- ствие, которое не зависит от состояния иммунитета. Если оба раздражителя вызовут сходную реакцию, рассуждал автор, то в обоих случаях она не отражает состояния иммунитета.
В табл. 9.7 приведены результаты опыта. Знак «плюс» соот- ветствует наличию реакции, знак «минус» — отсутствию. При виде такой таблицы хочется немедленно рассчитать
χ
2
. Посмот-
* J. A. Roth, F. R. Eilber, J. A. Nizle, D. L. Morton. Lack of correlation between skin reactivity to dinitrochlorobenzene and croton oil in patients with cancer.
N. Engl. J. Med., 293:388–389, 1975.
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ