ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.12.2023
Просмотров: 578
Скачиваний: 7
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
286
Для сравнения нескольких измерений, выполненных у каж- дого из больных, предназначен дисперсионный анализ повтор-
ных измерений, В нем разброс результатов измерений разлага- ется на три составляющие: разброс значений между больными,
в реакциях одного и того же больного и, наконец, между мето- дами лечения. Как обычно, рассматриваемые процедуры осно- ваны на предположении о нормальном распределении измеряе- мого признака. (В гл. 10 излагаются не требующие этого ранго- вые методы.) И, завершая рассмотрение методов анализа повтор- ных измерений, мы разберем критерий Мак-Нимара. Он позво- ляет выявить изменения не числовых, а качественных призна- ков, представленные таблицами сопряженности.
ПАРНЫЙ КРИТЕРИЙ СТЬЮДЕНТА
Раньше, чтобы оценить эффективность лечения, мы выбирали две группы. Одна проходила лечение, другая нет. Затем мы вы- числяли среднее по каждой группе и определяли статистичес- кую значимость различия этих средних. Теперь мы набираем
одну группу, измеряем у каждого больного значение признака
до и после лечения и вычисляем изменение признака. Затем на- ходим среднее изменение и проверяем статистическую значи- мость его отличия от нуля.
Такой подход более точно улавливает различия, вызванные лечением, нежели сравнение двух независимых групп, «зашум- ленное» разбросом значений у разных больных.
Почему такой подход повышает чувствительность критерия,
легко понять из следующего примера. На рис. 9.1 А и 9.1 Б пред- ставлены одни и те же данные. Различие в том, как они по- лучены. Данные на рис. 9.1А получены в результате наблюде- ния за двумя независимыми группами: левый столбец образуют данные о суточном диурезе больных, получавших плацебо, пра- вый — получавших препарат. Напротив, оба столбца на рис. 9.1Б
относятся к одним и тем же больным, левый содержит данные о величине диуреза до приема препарата, правый — после при- ема. Отрезками соединены пары точек, относящиеся к одному больному.
ГЛАВА 9
287
Глядя на рис. 9.1 А, никак не скажешь, что препарат оказы- вает диуретический эффект. Разброс данных слишком велик по сравнению со скромной тенденцией к увеличению диуреза.
Вычислив критерий Стьюдента, получим t = 1,33. Это меньше
t
0,05
=2,101 — критического значения при уровне значимости 0,05
и числе степеней свободы
ν = 2(n – 1) = 2(10 – 1) = 18. Тем самым, статистически значимых различий не выявлено.
Казалось бы, результат в случае повторных измерений (рис.
9.1Б) будет таким же. Ведь положение точек на рисунках совпа- дает. Однако теперь мы располагаем дополнительной ин- формацией: мы знаем, как изменился диурез у каждого больно-
Рис. 9.1. А. Суточный диурез у 10 человек после приема плацебо и у других 10 человек после приема препарата (предполагаемого диуретика). На основании таких данных нельзя сделать вывод о наличии диуретического эффекта. Б. Суточный диурез у 10 че- ловек после приема плацебо и у них же— после приема препарата. Диуретический эф- фект налицо. Обратите внимание, что положение точек на обоих графиках одинаково.
Учет изменения диуреза у каждого обследованного в отдельности позволил выявить эффект, который был скрыт, пока мы рассматривали группы в целом.
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ
288
го. Судя по наклону отрезков, препарат увеличил диурез у 8 из
10 больных. А это достаточно веский довод в пользу того, что препарат — диуретик.
Перейдем к количественной оценке этого впечатления. Оце- нить статистическую значимость изменения позволяет парный
критерий Стьюдента. Нулевая гипотеза будет состоять в том,
что среднее изменение равно нулю.
В общем случае критерий Стьюдента можно представить в таком виде:
Оценка параметра Истинное значение параметра
Стандартная ошибка оценки параметра
t
−
=
Интересующий нас параметр — истинное среднее измене- ние диуреза — обозначим
δ. Его оценкой является наблюдае- мое (выборочное) среднее изменение диуреза d . Выборочное стандартное отклонение изменения диуреза составляет
(
)
2
,
1
d
d d
s
n
−
=
−
∑
а стандартная ошибка
d
d
s
s
n
=
Таким образом, критерий Стьюдента принимает вид:
d
d
t
s
− δ
=
При условии справедливости нулевой гипотезы
δ = 0. Подста- вив это значение в формулу, получим:
d
d
t
s
=
Осталось сравнить полученное значение с критическим для выбранного уровня значимости и числа степеней свободы
ν = n – l.
Подытожим. Когда имеются данные об изменении интересу-
ГЛАВА 9
289
ющего признака у каждого больного, для оценки статистичес- кой значимости этих изменений нужно сделать следующее.
• Вычислить величину изменения для каждого больного d.
• Вычислить среднее этих изменений d и его стандартную ошибку
d
s .
• Вычислить значение критерия Стьюдента
d
t d s
=
• Сравнить полученное значение t с критическим для числа степеней свободы
ν = п – 1.
Если обычный критерий Стьюдента требует нормального распределения самих данных, то парный критерий Стьюдента требует нормального распределения их изменений.
Курение и функция тромбоцитов
Известно, что курение способствует развитию ишемический бо- лезни сердца. Известно также, что определенную роль в патоге- незе этого заболевания играют тромбоциты. Связан ли эффект курения с влиянием на тромбоциты? В поисках ответа на этот вопрос П. Левин исследовал влияние курения на функцию тром- боцитов*. Одним из показателей, который интересовал иссле- дователя, была агрегация тромбоцитов — доля тромбоцитов,
слипшихся под воздействием аденозиндифосфата — вещества,
стимулирующего агрегацию.
Одиннадцати добровольцам было предложено выкурить по сигарете. Перед курением и сразу после него были взяты пробы крови и определена агрегация тромбоцитов.
Результаты представлены на рис. 92. Левый столбик образо- вали наблюдения до выкуривания сигареты, правый — после.
Отрезками соединены наблюдения, относящиеся к одному доб- ровольцу. Когда из одной точки на рисунке выходит два отрезка,
это значит, что данный результат наблюдался у двух больных.
Агрегация тромбоцитов до курения составила в среднем 43,1%,
после курения — 53,5%. Стандартные отклонения равны 15,9 и
18,7% соответственно. Уже при взгляде на эти цифры ясно, что о статистической значимости различий вряд ли может идти речь.
* P. H. Levine. An acute effect of cigarette smoking on platelet function: a possible link between smoking and arterial thrombosis. Circulation, 48: 619-623, 1973.
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ
290
Действительно, расчет критерия Стьюдента в том виде, в каком он был изложен в гл. 4, дает t = 1,405, что меньше критического значения для 5% уровня значимости и 20 степеней свободы. При сравнении двух независимых групп следовало бы признать вли- яние курения статистически не значимым. Однако в данном слу- чае наблюдалась одна группа, причем данные позволяют вы- числить изменения для каждого ее члена.
Сделав это, мы обнаружим, что у всех обследованных, за ис-
1 ... 19 20 21 22 23 24 25 26 ... 37
Рис. 9.2. Агрегация тромбоцитов до и после выкуривания сигареты. Агрегация тромбо- цитов повысилась, но значит ли это, что она повысилась от табака?
ГЛАВА 9
291
ключением одного, агрегация тромбоцитов после курения по- высилась. Выпишем изменения у каждого из обследованных.
Получим 2, 4, 10, 12, 16, 15, 4, 27, 9, –1 и 15%. Средняя величи- на изменения d = 10,3%. Стандартное отклонение величины изме- нения s
d
= 8% и стандартная ошибка
8,0 11 2, 41%.
d
s
=
=
=
Тог- да:
10,3 4, 27.
2, 41
d
d
t
s
=
=
=
В табл. 4.1 находим критическое значение t
0,01
для уровня зна- чимости 0,01 и
ν = п – 1 степеней свободы. Оно равно 3,169, то есть меньше полученного нами. Таким образом, повышение аг- регации тромбоцитов после курения статистически значимо.
На этом выводе Левин не остановился. Если курение повы- шает агрегацию тромбоцитов, то значит ли это, что повышение вызвано курением табака! Нет, не значит. С тем же успехом можно признать причиной вдыхание окиси углерода, выделяю- щейся при горении сигареты. Не менее веской причиной будет и волнение, испытываемое участниками эксперимента. Имеющиеся данные не позволяют отвергнуть такие объяснения. Значит, нуж- но провести эксперименты, совпадающие с исходным во всем,
кроме интересующего нас фактора — в данном случае курения сигарет с табаком. Именно это и сделал Левин. Добровольцам пришлось выкуривать не только обычные, но и безникотиновые сигареты из салатных листьев. Кроме того, им предлагали по- держать в зубах незажженную сигарету, изображая курение.
Результаты приведены на рис. 9.3 вместе с данными с рис. 9.2.
Оказалось, что в отличие от обычной сигареты незажженная или безникотиновая сигарета не вызывает повышения агрегации тромбоцитов.
Разобранное исследование служит иллюстрацией следующе- го правила.
Единственным различием между контрольной и
экспериментальной группой должно быть воздействие иссле-
дуемого, и никакого другого, фактора.
Чем лучше удается вычленить действие изучаемого фактора,
тем достовернее выводы эксперимента. Так, рассмотренный экс-
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ
292
перимент доказал, что повышение агрегации тромбоцитов вы- звано не просто курением, а именно курением табака.
Затронув вопрос о планировании эксперимента, стоит упо- мянуть еще об одной важной проблеме. Кроме необходимости выделить исследуемый фактор и тем самым исключить неодно- значное толкование результатов эксперимента, нужно избежать искажений, привносимых участниками эксперимента. В меди-
Рис. 9.3. Агрегация тромбоцитов до и после изображения курения с незажженной сига- ретой, выкуривания сигареты с салатными листьями, выкуривания сигареты с табаком.
Похоже, что именно табак, а не сам факт курения и не дым вызывает повышение агре- гации тромбоцитов.
ГЛАВА 9
293
цинских экспериментах человек не только оказывает воздействие и наблюдает его результат — он присутствует и как объект на- блюдений. Но люди пристрастны и внушаемы. Пристрастность экспериментатора может повлечь неосознанную подтасовку. А
лаборантке, поборнице некурения, не составит труда чуть-чуть завысить долю склеившихся тромбоцитов в крови курилыцика и чуть-чуть занизить ее для некурящего.
При проведении клинических испытаний на первый план выходит роль больного. Особенно велика она, если критерием эффективности служат его собственные оценки (боль умень- шилась — усилилась, стал спать лучше — хуже). Вера больно- го в новый метод лечения — могучий (и благотворный) фактор,
однако объективной оценке он мешает. Вернемся к исследова- ниям агрегации тромбоцитов. Как в данном случае на результат эксперимента может повлиять испытуемый? Человек не может усилием воли изменять состояние своих тромбоцитов, однако,
обратившись еще раз к рис. 9.3, можно заметить, что у добровольцев, которым только еще предстояло выкурить (воз- можно, безвредную салатную) сигарету, агрегация тромбоци- тов была заметно выше, чем у тех, которым было известно, что им придется лишь подержать сигарету в зубах. Следовательно,
не только субъективные оценки, но и объективные показатели могут изменяться под влиянием отношения испытуемого к экспериментальному воздействию.
Чтобы исключить влияние субъективного фактора, Левин применил двойной слепой метод. Суть метода в том, что экс- периментальное воздействие не известно ни испытуемым, ни наблюдателям, оценивающим его результаты. В эксперименте
Левина ни исследователям, ни добровольцам не было известно содержимое сигарет, а производившим анализ крови лаборан- там — курил ли доброволец, и если да, то что именно.
В действительности исследование Левина не было полнос- тью двойным слепым (о чем свидетельствуют различия исход- ной агрегации тромбоцитов). Действительно, даже если о со- держимом сигареты добровольцам не сообщали, они могли легко определить его на вкус.
Предвидя подобные трудности, исследование часто заранее планируют как простое слепое. В этом случае одна из сторон
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ
294
(обычно наблюдатель) осведомлена о характере эксперимен- тального воздействия, а другая (обычно испытуемый) — нет.
Наконец, характер исследования может быть таков, что ни одну из сторон нельзя держать в полном неведении и обе располага- ют частью информации — в таких случаях говорят о частично
слепом исследовании.
Завершая обсуждение парного критерия Стьюдента, повто- рим, что он используется для проверки эффективности одного
метода лечения в случае, когда имеются данные о состоянии каждого участника до и после лечения. Когда же требуется срав- нить эффективность нескольких методов лечения, испытанных на одних и тех же больных, применяют дисперсионный анализ
повторных наблюдений. Для его изложения нам потребуется пересмотреть тот вариант дисперсионного анализа, который был изложен в гл. 3, то есть вариант на случай использования раз-
ных методов для лечения разных больных. Затем перейдем к варианту дисперсионного анализа на случай повторных наблю- дений за одними и теми же больными, подвергаемыми разным методам лечения.
НОВЫЙ ПОДХОД К ДИСПЕРСИОННОМУ АНАЛИЗУ*
Напомним вкратце схему дисперсионного анализа, изложенную в гл. 3. В качестве нулевой гипотезы мы брали предположение о том, что несколько (обычно более двух) методов лечения облада- ют равной эффективностью, то есть экспериментальные груп- пы — это просто выборки из одной нормально распределенной совокупности и различия между ними обусловлены случайно- стью. Для проверки нулевой гипотезы мы сравнивали разброс
* Если этот раздел, посвященный дисперсионному анализу повтор- ных измерений, покажется вам слишком утомительным из-за оби- лия выкладок, пропустите его при первом чтении. Только не забудь- те вернуться, когда возникнет необходимость. А она обязательно воз- никнет. Эксперименты, для обработки которых предназначен этот вариант дисперсионного анализа, типичны для медицины. Сам же анализ, увы, не очень. Чаще приходится сталкиваться с многократ- ным использованием критерия Стьюдента, совершенно ошибочным
(см. гл. 4).
ГЛАВА 9