Файл: Книга Primer of biostatistics fourth edition.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.12.2023

Просмотров: 589

Скачиваний: 7

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

217
придется отказаться: при малых выборках интервал получается слишком узким.
Рассмотрим пример. На рис. 2.6 представлены распределе- ние по росту всех 200 ныне живущих марсиан, а также три слу- чайные выборки по 10 марсиан в каждой. Рост 95% всех марси- ан лежит в пределах от 31 до 49 см. Средний рост марсианина
— 40 см, стандартное отклонение — 5 см. Три выборки, изоб- раженные в нижней части рисунка, дают следующие оценки среднего роста: 41,5, 36 и 40 см. Выборочные стандартные от- клонения — соответственно 3,8, 5 и 5 см. Применим к этим вы- борочным оценкам правило двух стандартных отклонений. По- лученные доверительные интервалы изображены на рис. 7.5А.
Как видим, в двух из трех случаев интервалы не покрывают 95%
всех членов совокупности.
Причина, в общем, понятна. Выборочное среднее и выбо-
Рис. 7.5. 95% доверительные интервалы для роста марсиан, вычисленные по трем выборкам с рис. 2.6. А. В качестве доверительного интервала использо- вали среднюю величину плюс-минус два стандартных отклонения. Результат оставляет желать лучшего: два интервала из трех не покрывают истинного ин- тервала, заключающего 95% значений. Б. Доверительные интервалы опреде- лили как среднее плюс-минус произведение К
0,05
на стандартное отклонение.
Ситуация улучшилась — теперь истинный интервал покрывают два интервала.
ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ

218
рочное стандартное отклонение — не более чем оценки истинно- го среднего и стандартного отклонения. Точность этих оценок при малом объеме выборок невелика. Ошибка в оценке одного параметра накладывается на ошибку в оценке другого — в ре- зультате шансы получить правильный результат и вовсе низки.
Рассмотрим выборку на рис. 2.6В. Нам повезло — оценка стан- дартного отклонения совпала с истинным его значением 5 см.
Однако оценка среднего оказалась заниженной — 36 см вместо
40 см. Поэтому интервал смещен относительно истинного сред- него и накрывает менее 95% всех значений.
Учитывая приблизительность оценок по выборкам небольшого объема, нужно брать интервал, более широкий, чем плюс-минус два стандартных отклонения (при выборках большого объема та- кая страховка не нужна). Этот интервал вычисляют по формуле
,
X
K s X
X
K s
α
α

< < +
где X — выборочное среднее, s — выборочное стандартное от- клонение, а К
α
коэффициент, который зависит от доли f чле- нов совокупности, которые должны попасть в доверительный интервал, от вероятности того, что они действительно туда попа- ли 1 –
α и от объема выборки п. Этот коэффициент играет при- мерно ту же роль, что t
α
или z
α
. Для вычисления 95% довери- тельного интервала нужно определить К
0,05
; зависимость К
0,05
от объема выборки для различных значений f показана на рис. 7.6.
Заметим, что К
α
больше, чем t
α
(как t
α
больше, чем z
α
), по- скольку учитывает не только значение среднего, но и неопреде- ленность оценок среднего и стандартного отклонения*.
При объеме выборки от 5 до 25, типичном для медицинских исследований, К
α
должен быть существенно больше двух. Если бы в рассматриваемом случае мы взяли интервал в плюс-минус два стандартных отклонения от среднего, то он покрыл бы за- метно менее 95% совокупности. На рис. 7.5Б изображены 95%
доверительные интервалы для роста 95% членов совокупности
* Вывод формулы для К
α
, показывающий его связь с доверительными ин- тервалами для среднего и стандартного отклонения, можно найти, на- пример, в работе: А. Е. Lewis, Biostatistics, Reinhold, New York, 1966,
Chap. 12. Tolerance limits and indices of discrimination.
ГЛАВА 7


219
марсиан, построенные по трем выборкам с рис. 2.6. Теперь все три интервала покрывают не менее 95% членов совокупности.
Применение правила двух стандартных отклонений к выбор- кам небольшого объема приводит к зауживанию доверительно- го интервала значений. Упомянем еще об одной распространен- ной ошибке. Как говорилось в гл. 2, многие путают стандарт- ную ошибку среднего со стандартным отклонением. Найдя ин- тервал «выборочное среднее плюс-минус две стандартные ошиб- ки среднего», они уверены, что в него попадет 95% совокупно- сти (тогда как на самом деле 95% составляет вероятность, что в интервал попадет среднее по совокупности). В результате ин- тервал допустимых значений оказывается еще более зауженным.
ЗАДАЧИ
1   ...   14   15   16   17   18   19   20   21   ...   37

7.1. По данным из задачи 2.6 найдите 90 и 95% доверитель- ные интервалы для среднего числа авторов статей, опублико- ванных в медицинских журналах за 1946, 1956, 1966 и 1976 гг.
7.2. Ранее (задача 3.1) мы познакомились с исследованием
Рис. 7.6. Коэффициент К
0,05
зависит от объема выборки и от доли членов совокупности
f, которые должны попадать в 95% доверительный интервал.
ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ

220
Ч. О’Херлихи и Г. Мак-Дональда (С. O’Herlihy, H. MacDonald.
Influence of preinduction prostaglandin E
2
vaginal gel on cervical ripening and labor. Obstet. Gynecol., 54:708—710, 1979). Как выяснилось, гель с простагландином Е
2
сокращает продолжи- тельность родов. Позволяет ли он избежать кесарева сечения?
В группе, получавшей гель с простагландином Е
2
, кесарево се- чение потребовалось 15% женщин, в контрольной группе —
23,9%. В обеих группах было по 21 женщине. Найдите 95 %
доверительные интервалы для доли рожениц, которым требу- ется кесарево сечение в обеих группах. Найдите 95% довери- тельный интервал для разности долей. Можно ли утверждать,
что простагландин снижает вероятность кесарева сечения?
7.3. По данным задачи 3.1 найдите 95% доверительный ин- тервал для разности средней продолжительности родов у полу- чавших гель с простагландином Е
2
и получавших плацебо. Поз- воляет ли вычисленный доверительный интервал утверждать,
что различия статистически значимы?
7.4. По данным задачи 5.1 найдите 95% доверительные интер- валы для долей больных, которые не чувствовали боли при вклю- ченном и выключенном приборе. Можно ли по этим интервалам оценить статистическую значимость различий?
7.5. Поданным задачи 3.2 найдите 95% доверительные интер- валы для каждой из групп. В чем заключаются различия между группами?
7.6. По данным задачи 5.6 найдите 95% доверительные интер- валы для доли работ, где данные были получены до планиро- вания исследования.
7.7. По данным задачи 2.2 найдите 95% доверительные интер- валы для 90 и 95% значений. Результаты представьте на одном рисунке с исходными данными.
ГЛАВА 7

Глава 8
Анализ зависимостей
Самый первый из рассмотренных нами примеров (рис. 1.2) был посвящен вопросу об эффективности диуретика. Пяти людям дали разные дозы препарата, измерили диурез и увидели, что чем больше доза, тем больше диурез. В дальнейшем оказалось,
что этот результат не отражает реальной картины и что никакой связи между дозой и диурезом на самом деле нет. Тогда мы еще не знали о методах анализа зависимостей. Им посвящена эта глава. Мы узнаем, как с помощью уравнения регрессии выра- зить связь между дозой диуретика и диурезом (так называемый
регрессионный анализ) и как с помощью коэффициента корре-
ляции измерить силу этой связи.
Подобно тому как мы поступали в предыдущих главах, рас- смотрим сначала уравнение регрессии для совокупности, а затем выясним, как оценивать его параметры по выборке. В гл. 3 и 4 мы брали нормально распределенную совокупность, находили па- раметры распределения (среднее
µ и стандартное отклонение α),
затем находили выборочные оценки этих параметров (X и s


222
использовали их для оценки значимости различий между группа-
ми, например получавших препарат и не получавших. Теперь мы также будем иметь дело с нормально распределенной совокуп- ностью, но группа будет только одна. Интересовать же нас будет
связь между двумя количественными признаками, характеризую- щими членов этой группы, например между дозой препарата и эффектом, ростом и весом. Мы ограничимся случаем линейной
зависимости двух переменных*.
Сколько весит марсианин?
Итак, начнем с совокупности. Совокупность марсиан нами уже достаточно хорошо изучена, особенно что касается роста. Но ведь мы их еще и взвешивали! Разберемся, как связаны вес и рост. Вы, конечно, помните, что на Марсе живет 200 марсиан. В
гл. 2 мы обнаружили, что их рост подчиняется нормальному распределению со средним
µ = 40 см и стандартным отклоне- нием
σ = 5 см. Оказывается, что вес марсиан тоже подчиняется нормальному распределению с параметрами
µ = 12г и σ =2,5г.
Но самое замечательное, что отчетливо видно на рис. 8.1, — это зависимость веса от роста. Как правило, чем больше рост марсиани-
на, тем больше вес, причем эта зависимость линейна.
Посмотрим, сколько весят марсиане, чей рост равен 32 см.
Таких марсиан четверо, а их вес равен соответственно 7,1; 7,8;
8,3 и 8,8 г. Таким образом, средний вес марсиан ростом 32 см равен 8 г. Восемь марсиан ростом 46 см весят 13,7; 14,5; 14,8;
15,0; 15,1; 15,2; 15,3 и 15,8 г. Их средний вес 15 г. Если для каж- дого значения роста мы подсчитаем соответствующий ему сред- ний вес, то окажется, что найденные значения лежат на прямой
линии, как изображено на рис. 8.2.
Теперь, выбрав какой-то рост, мы всегда сможем примерно определить вес марсианина этого роста. Точнее, мы сможем оп-
* Линейная зависимость у от х определяется формулой у =
α + βх. Воз- можна нелинейная зависимость, например у =
α + βх
2
. Возможна и мно- жественная зависимость, когда определяющих признаков более одно- го, например у =
α + βх +
γz. Она рассматривается в книге S. Glantz, В.
Slinker. Primer of applied regression and analysis of variance. McGraw-
Нill, New York, 1990.
ГЛАВА 8

223
Рис. 8.1. Рост и вес марсиан. Как известно, число обитателей Марса составляет 200;
каждый из них был измерен и взвешен, результат нанесен на график в виде кружка.
Распределение марсиан по росту и по весу нормально. Более того, средний вес марсиан определенного роста связан с ростом линейной зависимостью; разброс значений веса для всех ростов одинаков. Чтобы к совокупности можно было применить регрессион- ный анализ, она должна обладать всеми этими свойствами.
АНАЛИЗ ЗАВИСИМОСТЕЙ


224
Рис. 8.2. Если рассчитать средний вес марсиан разного роста и нанести полученные значения на график, окажется, что они образуют прямую линию. Иначе говоря, средний вес марсиан линейно зависит от роста.
ГЛАВА 8

225
ределить средний вес марсиан этого роста, поскольку для каждо- го роста существует определенный разброс веса. Разброс этот,
кстати, можно оценить, рассчитав стандартное отклонение веса для каждого роста. Оказывается, какой бы рост мы ни взяли,
стандартное отклонение веса составит 1 г, что заметно меньше стандартного отклонения веса для всей, не разделенной по ве- сам, совокупности марсиан.
УРАВНЕНИЕ РЕГРЕССИИ
Прежде чем перейти к обобщению этих закономерностей, да- дим несколько определений. В уравнении регрессии одна из переменных, х, называется независимой переменной, а другая, у, —
зависимой. Набор значений у, соответствующих определенно- му значению х, обозначим у|х.
В примере с марсианами рост мы будем рассматривать как независимую переменную, а вес — как зависимую. Понятно, что это не означает, что одна переменная действительно определяет
другую. Просто по значению одного признака мы предсказываем
значение второго. В условиях эксперимента мы произвольно ме- няем независимую переменную и смотрим, как меняется зави- симая. При этом речь действительно идет о зависимости, то есть о причинной связи. В прочих же случаях выявление статисти-
ческой связи двух переменных указывает на возможность причин-
ной связи, но не доказывает ее. Разобраться в причинах и следст- виях вообще невозможно чисто статистическими методами. Не- обходимо, в частности, найти биологический механизм, порож- дающий выявленную связь. Например, эпидемиологические дан- ные о связи пассивного курения с заболеваемостью ишемичес- кой болезнью сердца еще не доказывают, что пассивное курение способствует развитию ИБС. Может быть, и то и другое — след- ствие какой-либо неизвестной причины, например нервной об- становки в рабочем коллективе. Однако экспериментальные дан- ные* о том, что пассивное курение и отдельные компоненты та-
* О том, как анализировать совокупность эпидемиологических и экс- периментальных данных для выявления причинных связей, можно прочесть в работах: S. A. Glantz, W. W. Parmley. Passive smoking and
АНАЛИЗ ЗАВИСИМОСТЕЙ

226
бачного дыма вызывают поражение сердца у лабораторных жи- вотных, говорят в пользу именно причинной связи.
Вернемся к нашим марсианам. Для каждого значения неза- висимой переменной х (в нашем примере это рост) рассчитаем среднее значение зависимой переменной у (вес). Это среднее в точке х обозначим
µ
y|x
. Тогда обнаруженная нами линейная за- висимость описывается уравнением
µ
y|x
=
α + βx.
Здесь
α — значение у в точке х = 0 (коэффициент сдвига), β —
коэффициент наклона*. В нашем примере при увеличении роста на 1 см средний вес увеличивается на 0,5 г, поэтому
β =0,5. Хотя представить марсиан весом –8 г не легче, чем ростом 0 см, тем не менее для прямой с рис. 8.2 имеем
α = –8 г. Таким образом, пря- мая средних (для каждого роста) весов задается формулой
µ
y|x
= –8 + 0,5x.
Теперь посмотрим, как распределены веса марсиан одного роста. В данном случае это нормальное распределение со сред- ним
µ
y|x
и стандартным отклонением
σ
y|x
. Но этого еще недоста- точно для применения методов, которые мы рассмотрим ниже.
Помимо нормальности распределения требуется, чтобы
σ
y|x
было
одинаковым для разных х. Иначе говоря разброс значений зависи- мой случайной переменной у должен быть неизменным при лю- бом значении независимой переменной х. В нашем примере это условие выполняется.
Итак, значения переменных должны удовлетворять следую- щим условиям.
• Среднее значение
µ
y|x
линейно зависит от х.
• Для любого значения х значения у|х распределены нормально.
• Стандартное отклонение
σ
y|x
одинаково при всех значениях х.
Функция, задающая зависимость
µ
y|x
от х, определяется па- heart disease: epidemiology, physiology, and biochemistry. Circulation,
83:1—12,1991 и S. A. Glantz, W. W. Parmley. Passive smoking and heart disease: mechanisms and risk. JAMA, 273:1047—1053, 1995.
* Эти обозначения совпадают с обозначениями ошибок I и II рода. Будем надеятся. что это не породит путаницы.
ГЛАВА 8