Файл: Книга Primer of biostatistics fourth edition.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.12.2023

Просмотров: 562

Скачиваний: 7

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

38
оценить точность, с которой выборочное среднее характеризу- ет значение среднего по всей совокупности.
На рис. 2.6А представлено уже знакомое нам распределение марсиан по росту. Мы уже знаем рост каждого марсианина. По- смотрим, что получится, если оценивать средний рост по вы- борке объемом, скажем, 10 марсиан.
Из 200 обитателей Марса наугад выберем 10 и пометим их черными кружками (рис. 2.6А). На рис. 2.6Б эта выборка изобра- жена в виде, принятом в журнальных публикациях. Точка и два
Рис. 2.6. Три случайные выборки из одной совокупности дают три разных оценки сред- него и стандартного отклонения.
ГЛАВА 2

39
отрезка по бокам от нее изображают выборочное среднее (X =
41,5 см) и выборочное стандартное отклонение (s = 3,8 см). Эти значения близки, но не равны среднему по совокупности
(
µ = 40 см) и стандартному отклонению (σ = 5 см).
Извлечем еще одну случайную выборку того же объема. Ре- зультат показан на рис. 2.6В. На рис. 2.6А попавшие в эту вы- борку марсиане изображены заштрихованными кружками. Вы- борочное среднее (36 см) по-прежнему близко к среднему по совокупности, хотя и отличается от него; что касается выбороч- ного стандартного отклонения (5 см), то на этот раз оно совпало со стандартным отклонением по совокупности.
На рис. 2.6Г представлена третья выборка. Попавшие в нее марсиане на рис. 2.6А изображены кружками с точками. Сред- нее и стандартное отклонение для этой выборки составляют со- ответственно 40 и 5 см.
Теперь пора поставить добычу случайных выборок на про- мышленную основу. Рассмотрим совокупность средних для каж-
дой из возможных выборок по 10 марсиан. Общее число таких выборок превышает 10 16
. Три из них мы уже обследовали. Сред- ние по этим выборкам представлены на рис. 2.7 в виде заполнен- ных кружков. Пустые кружки — это средние еще для 22 выборок.
Итак, теперь каждому выборочному среднему соответствует кружок,
Рис. 2.7. Такое распределение мы получим, выбрав 25 раз по 10 марсиан из совокупно- сти представленной на рис 2 6А, и рассчитав среднее для каждой выборки (средние для трех выборок с рис. 2.6 показаны заполненными кружками). Если построить распpeделе- ние средних для всех возможных выборок, оно окажется нормальным. Среднее этого распределения будет равно среднему той совокупности, из которой извлекаются вы- борки. Стандартное отклонение этого распределения называется стандартной ошибкой среднего.
30
35
40
45
50
КАК ОПИСАТЬ ДАННЫЕ

40
точно так же, как до сих пор кружки соответствовали отдельно- му объекту.
Посмотрим на рис. 2.7. Набор из 25 выборочных средних имеет колоколообразное распределение похожее на нормальное.
Это не случайно. Можно доказать, что если переменная пред- ставляет собой сумму большого числа независимых перемен- ных, то ее распределение стремится к нормальному, какими бы ни были распределения переменных, образующих сумму. Так как выборочное среднее определяется именно такой суммой, его распределение стремится к нормальному, причем чем больше объем выборок, тем точнее приближение. (Если выборки при- надлежат совокупности с нормальным распределением, распре- деление выборочных средних будет нормальным независимо от объема выборок).
Поскольку распределение на рис. 2.7 нормальное, его можно описать с помощью среднего и стандартного отклонения.
Так как среднее значение для рассматриваемых 25 точек есть среднее величин, которые сами являются средними значения- ми, обозначим его
X
X
. Аналогично, стандартное отклонение обозначим
X
s
. По формулам для среднего и стандартного откло- нения находим
X
X
= 40 см и
X
s = 1,6см.
Среднее выборочных средних
X
X оказалось равно среднему
µ всей совокупности из 200 марсиан. Ничего неожиданного в этом нет. Действительно, если бы мы провели исследования всех возможных выборок, то каждый из 200 марсиан был бы выбран равное число раз. Итак, среднее выборочных средних совпадет
со средним по совокупности.
Интересно, равно ли
X
s
стандартному отклонению,
σ сово- купности из 200 марсиан? Стандартное отклонение для сово- купности выборочных средних
X
s равно 1,6 см, а стандартное отклонение самой совокупности — 5 см. Почему
X
s меньше,
чем
σ? В общих чертах это можно понять, если учесть, что в случайную выборку редко будут попадать одни только коротыш- ки и одни гиганты. Чаше их будет примерно поровну, и откло- нения роста от среднего будут сглаживаться. Даже в выборке,
куда попадут 10 самых высоких марсиан, средний рост соста- вит только 50 см, тогда как рост самого высокого марсианина
— 53 см.
Подобно тому, как стандартное отклонение исходной выбор-
ГЛАВА 2


41
ки из 10 марсиан s служит оценкой изменчивости роста марси- ан,
X
s
является оценкой изменчивости значений средних для вы- борок по 10 марсиан в каждой. Таким образом, величина
X
s слу- жит мерой точности, с которой выборочное среднее X является оценкой среднего по совокупности
µ. Поэтому
X
s
носит назва- ние стандартной ошибки среднего.
Чем больше выборка, тем точнее оценка среднего и тем мень- ше его стандартная ошибка. Чем больше изменчивость исход- ной совокупности, тем больше изменчивость выборочных сред- них, поэтому стандартная ошибка среднего возрастает с увели- чением стандартного отклонения совокупности.
Истинная стандартная ошибка среднего по выборкам объе- мом n, извлеченным из совокупности, имеющей стандартное отклонение
σ, равна*:
X
n
σ
σ =
Собственно стандартная ошибка — это наилучшая оценка величины
X
σ по одной выборке:
X
s
s
n
=
,
где s — выборочное стандартное отклонение.
Так как возможные значения выборочного среднего стремятся к нормальному распределению, истинное среднее по совокуп- ности примерно в 95% случаев лежит в пределах 2 стандартных ошибок выборочного среднего.
Как уже говорилось, распределение выборочных средних приближенно всегда следует нормальному распределению не- зависимо от распределения совокупности, из которой извлече- ны выборки. В этом и состоит суть утверждения, называемого
центральной предельной теоремой. Эта теорема гласит следу- ющее.
• Выборочные средние имеют приближенно нормальное рас- пределение независимо от распределения исходной совокуп- ности, из которой были извлечены выборки.
* Вывод этой формулы приведен в гл. 4.
КАК ОПИСАТЬ ДАННЫЕ

42
• Среднее значение всех возможных выборочных средних рав- но среднему исходной совокупности.
• Стандартное отклонение всех возможных средних по выбор- кам данного объема, называемое стандартной ошибкой сред- него, зависит как от стандартного отклонения совокупнос- ти, так и от объема выборки.
На рис. 2.8 показано, как связаны между собой выборочное среднее, выборочное стандартное отклонение и стандартная ошибка среднего и как они изменяются в зависимости от объе- ма выборки*. По мере того как мы увеличиваем объем выбор- ки, выборочное среднее X и стандартное отклонение s дают все более точные оценки среднего
µ и стандартного отклонения σ
по совокупности. Увеличение точности оценки среднего отра- жается в уменьшении стандартной ошибки среднего
X
σ . На- брав достаточное количество марсиан, можно сделать стандар- тную ошибку среднего сколь угодно малой. В отличие от стан- дартного отклонения стандартная ошибка среднего ничего не говорит о разбросе данных, — она лишь показывает точность выборочной оценки среднего.
Хотя разница между стандартным отклонением и стандарт- ной ошибкой среднего совершенно очевидна, их часто путают.
Большинство исследователей приводят в публикациях значение стандартной ошибки среднего, которая заведомо меньше стан- дартного отклонения. Авторам кажется, что в таком виде их дан- ные внушают больше доверия. Может быть, так оно и есть, од- нако беда в том, что стандартная ошибка среднего измеряет именно точность оценки среднего, но никак не разброс данных,
который и интересен читателю. Мораль состоит в том, что, опи- сывая совокупность, всегда нужно приводить значение стандар- тного отклонения.
* Рис. 2.8 получился следующим образом. Из совокупности марсиан (рис.
2.1) взяли наугад двух марсиан. По этой выборке вычислили X , s и
X
s .
Потом опять же наугад выбрали еще одного марсианина и добавив его к выборке снова рассчитали эти показатели. Добавляя каждый раз по одно- му случайно выбранному марсианину, объем выборки довели до 100. Если бы мы повторили эксперимент, очередность извлечения марсиан была бы иной, и рисунок выглядел бы немного иначе.
ГЛАВА 2


43
Рассмотрим пример, позволяющий почувствовать различие между стандартным отклонением и стандартной ошибкой сред- него, а также уяснить, почему не следует пренебрегать стандар- тным отклонением. Положим, исследователь, обследовав выборку из 20 человек, пишет в статье, что средний сердечный выброс составлял 5,0 л/мин со стандартным отклонением 1 л/мин. Мы знаем, что 95% нормально распределенной совокупности попа- дает в интервал среднее плюс–минус два стандартных отклоне-
1   2   3   4   5   6   7   8   9   ...   37

Рис. 2.8. С увеличением объема выборки возрастает точность оценки параметров распределения. Выборочное среднее
X
стремится к среднему в совокупности
µ вы- борочное стандартное отклонение s стремится к стандартному отклонению в сово- купности
σ, а стандартная ошибка среднего стремится к нулю.
КАК ОПИСАТЬ ДАННЫЕ

44
ния. Тем самым, из статьи видно, что почти у всех обследованных сердечный индекс составил от 3 до 7 л/мин. Такие сведения весь- ма полезны, их легко использовать во врачебной практике.
Увы, приведенный пример далек от реальности. Скорее ав- тор укажет не стандартное отклонение, а стандартную ошибку среднего. Тогда из статьи вы узнаете, что «сердечный выброс составил 5,0 ± 0,22 л/мин». И если бы мы спутали стандартную ошибку среднего со стандартным отклонением, то пребывали бы в уверенности, что 95% совокупности заключено в интервал от 4,56 до 5,44 л/мин. На самом деле в этом интервале (с вероят- ностью 95%) находится среднее значение сердечного выброса.
(В гл. 7 мы поговорим о доверительных интервалах более под- робно). Впрочем, стандартное отклонение можно рассчитать самому — для этого нужно умножить стандартную ошибку сред- него на квадратный корень из объема выборки (численности группы). Правда, для этого нужно знать, что же именно приво- дит автор — стандартное отклонение или стандартную ошибку среднего.
ВЫВОДЫ
Когда совокупность подчиняется нормальному распределению,
она исчерпывающе описывается параметрами распределения
средним и стандартным отклонением. Когда же распределение сильно отличается от нормального, более информативны медиа- на и процентили.
Так как наблюдать всю совокупность удается редко, мы оце-
ниваем параметры распределения по выборке, случайным об- разом извлеченной из совокупности. Стандартная ошибка сред- него служит мерой точности, с которой выборочное среднее яв- ляется оценкой среднего по совокупности.
Эти величины полезны не только для описания совокупнос- ти или выборки. Их можно также использовать для проверки статистических гипотез, в частности о различиях между груп- пами.
Этому и будет посвящена следующая глава.
ГЛАВА 2

45
ЗАДАЧИ
2.1. Найдите среднее, стандартное отклонение, медиану, 25- й и 75-й процентили для следующей выборки 0; 0; 0; 1; 1; 1; 1;
1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 3; 4; 4; 5; 5; 5; 5; 6; 7; 9; 10; 11.
Можно ли считать, что выборка извлечена из совокупности с нормальным распределением? Обоснуйте свой ответ. (Приве- денные числа — клинические оценки тяжести серповиднокле- точной анемии. Подробный анализ этого исследования см. в за- даче 8.9. Данные заимствованы из работы: R. Hebbel et al. Erythro- cyte adherence to endothelium in sickle-cell anemia: a possible determinant of disease seventy. N. Engl. J. Med., 302, 992–995, 1980).
2.2. Найдите среднее, стандартное отклонение, медиану, 25- й и 75-й процентили для следующих данных 289, 203, 359, 243,
232, 210, 251, 246, 224, 239, 220, 211. Можно ли считать, что выборка извлечена из совокупности с нормальным распределе- нием? Обоснуйте свой ответ. (Эти числа — продолжительность
(в секундах) физической нагрузки до развития приступа стено- кардии у 12 человек с ишемической болезнью сердца. Данные заимствованы из работы: W. Aronow. Effect of nonnicotine ciga- retts and carbon monoxide on angina. Circulation, 61:262–265, 1979.
Более подробно эта работа описана в задаче 9.5.)
2.3. Найдите среднее, стандартное отклонение, медиану, 25- й и 75-й процентили для следующих данных 1,2; 1,4; 1,6; 1,7;
1,7; 1,8; 2,2; 2,3; 2,4; 6,4; 19,0; 23,6. Можно ли считать, что это
— выборка из совокупности с нормальным распределением?
Обоснуйте свой ответ. (Приведены результаты оценки прони- цаемости сосудов сетчатки из работы: G. A. Fishman et al. Blood- retinal barrier function in patients with cone or cone-rod dystrophy.
Arch . Ophthalmol., 104:545–548, 1986.)
2.4. Опишите распределение числа очков, выпадающих при бросании игральной кости. Найдите среднее число очков.
2.5. Бросьте одновременно две игральные кости, посмотри- те, сколько очков выпало на каждой из них, и рассчитайте сред- нее. Повторите опыт 20 раз и постройте распределение сред- них, найденных после каждого броска. Что это за распределе- ние? Вычислите его среднее и стандартное отклонение. Что они характеризуют?
КАК ОПИСАТЬ ДАННЫЕ


46
2.6. Р. Флетчер и С. Флетчер (R. Fletcher, S. Fletcher. Clinical research in general medical journals: a 30-year perspective. N. Engl.
J. Med., 301:180–183, 1979) изучили библиографические харак- теристики 612 случайно выбранных статей, опубликованных в журналах Journal of American Medical Association, New England
Journal of Medicine и Lancet с 1946 г. Одним из показателей было число авторов статьи. Было установлено следующее:
Нарисуйте график среднего числа авторов по годам. Может ли распределение статей по числу авторов быть нормальным?
Почему?
Год
Число обследо-
Среднее число
Стандартное ванных статей авторов отклонение
1946 151 2,0 1,4 1956 149 2,3 1,6 1966 157 2,8 1,2 1976 155 4,9 7,3
ГЛАВА 2

Глава 3
Сравнение нескольких групп:
дисперсионный анализ
Статистические методы используют для описания данных и для оценки статистической значимости результатов опыта. В
предыдущей главе мы занимались описанием данных. Мы ввели понятия среднего, стандартного отклонения, медианы и процентилей. Мы узнали, как оценивать эти показатели по выборке. Мы разобрались, как определить, насколько точна выборочная оценка среднего. Перейдем теперь к методам оценки статистической значимости различий (их называют
критериями значимости, или просто критериями*). Мето- дов этих существует множество, но все они построены по одному принципу. Сначала мы формулируем нулевую ги-
потезу, то есть, предполагаем, что исследуемые факторы не оказывают никакого влияния на исследуемую величину и по- лученные различия случайны. Затем мы определяем, какова вероятность получить наблюдаемые (или более сильные) раз- личия при условии справедливости нулевой гипотезы. Если
* Критерием называют и сам метод, и ту величину, которая получается в результате его применения.

48
эта вероятность мала*, то мы отвергаем нулевую гипотезу и зак- лючаем что результаты эксперимента статистически значимы.
Это, разумеется, еще не означает что мы доказали действие имен- но изучаемых факторов (это вопрос прежде всего планирова- ния эксперимента), но, во всяком случае, маловероятно, что ре- зультат обусловлен случайностью.
Дисперсионный анализ был разработан в 20-х годах нашего столетия английским математиком и генетиком Рональдом Фи- шером. На дисперсионном анализе основан широкий класс кри- териев значимости, со многими из которых мы познакомимся в этой книге. Сейчас мы постараемся понять общий принцип этого метода.
СЛУЧАЙНЫЕ ВЫБОРКИ ИЗ НОРМАЛЬНО
РАСПРЕДЕЛЕННОИ СОВОКУПНОСТИ
Однажды в небольшом городке (200 жителей) ученые исследова- ли влияние диеты на сердечный выброс. Случайным образом ото- брали 28 человек, каждый из которых согласился участвовать в исследовании. После этого они опять таки случайным образом были разделены на 4 группы по 7 человеке каждой. Члены пер- вой (контрольной) группы продолжали питаться как обычно, чле- ны второй группы стали есть только макароны, третьей группы
— мясо, четвертой — фрукты. Через месяц у всех участников эксперимента измерили сердечный выброс. Результаты представ- лены на рис. 3.2.
Анализ данных мы начинаем с формулировки нулевой гипо- тезы. В данном случае она заключается в том, что ни одна из диет не влияет на сердечный выброс. Откроем маленький секрет, —
дело обстоит именно так. На рис. 3.1 показано распределение сердечного выброса для всех жителей городка, каждый житель представлен кружком. Члены наших экспериментальных групп изображены заштрихованными кружками. Все четыре группы
* Максимальную приемлемую вероятность отвергнуть верную нуле- вую гипотезу называют уровнем значимости и обозначают
α. Обычно принимают
α = 0,05.
ГЛАВА 3