Файл: Книга Primer of biostatistics fourth edition.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.12.2023

Просмотров: 566

Скачиваний: 7

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

49
представляют собой просто случайные выборки из нормально распределенной совокупности.
Однако как убедиться в этом, располагая только результата- ми эксперимента (рис. 3.2)? Как видно из рисунка 3.2, группы все же различаются по средней величине сердечного выброса.
Вопрос можно поставить так: какова вероятность получить та- кие различия, извлекая случайные выборки из нормально рас- пределенной совокупности? Прежде чем ответить на этот воп- рос нам надо получить показатель, характеризующий величину различий.
Оставим на время наш эксперимент и зададимся вопросом,
что заставляет нас, взглянув на несколько выборок думать, что различия между ними не случайны.
Попробуем (исключительно в учебных целях) так изменить наши данные, чтобы читатель поверил во влияние диеты на сер- дечный выброс. Результат этой подтасовки представлен на рис.
3.3. Взаимное расположение точек в группах осталось прежним,
но сами группы значительно раздвинуты по горизонтальной оси. Сравнив рис. 3.2 и 3.3 всякий скажет, что четыре вы-
Рис. 3.1. Распределение жителей городка по величине сердечного выброса. Диета не влияет на сердечный выброс, и экспериментальные группы представляют собой просто четыре случайные выборки из нормально распределенной совокупности.
СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ

50
борки на рис. 3.2 «не различаются», а выборки на рис. 3.3. —
«различаются». Почему? Сравним разброс значений внутри вы- борок с разбросом выборочных средних. Разброс выборочных средних на рис. 3.2. значительно меньше разброса значений в каж- дой из выборок. На рис. 3.3 картина обратная — разброс выбо- рочных средних превышает разброс в каждой из выборок. То же самое можно сказать и о данных на рис. 3.4, хотя здесь три выборочных
Рис. 3.2. Исследователь не может наблюдать совокупность, все, чем он располагает
– это его экспериментальные группы. На этом рисунке данные с рис. 3.1 представ- лены такими, какими их видит исследователь. Результаты в разных группах несколько различаются. Вызваны эти различия диетой или просто случайностью? Внизу ри- сунка показаны средние значения сердечного выброса в четырех группах (выбороч- ные средние) а также среднее и стандартное отклонение этих четырех средних.
ГЛАВА 3

51
средних близки друг другу и заметно отличается от них только одна.
Итак, чтобы оценить величину различий, нужно каким-то об- разом сравнить разброс выборочных средних с разбросом зна- чений внутри групп. Сейчас мы покажем, как это можно сде- лать с помощью дисперсии (как мы выяснили в предыдущей главе, этот показатель характеризует именно разброс), но преж- де сделаем несколько замечаний.
Дисперсия правильно характеризует разброс только в том случае,
если совокупность имеет нормальное распределение (вспомните
Рис. 3.3. Те же группы что на предыдущих рисунках; теперь они раздвинуты по гори- зонтальной оси. Вряд ли такие различия можно отнести на счет случайности — влия- ние диеты налицо! Обратите внимание, что разброс выборочных средних превышает разброс внутри групп. На предыдущем рисунке картина была иной, — разброс выбо- рочных средних был меньше разброса внутри групп.
СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ


52
обследование юпитериан, чуть было не приведшее к ошибоч- ным заключениям). Поэтому и критерий, основанный на дис- персии, применим только для нормально распределенных совокупностей.
Вообще, все критерии, основанные на оценке парамет- ров распределения (они называются параметрическими),
применимы только в случае, если данные подчиняются со- ответствующему распределению (чаще всего речь идет о нормальном распределении). Если распределение отличается от нормального, следует пользоваться так называемыми не- параметрическими критериями. Эти критерии не основаны на оценке параметров распределения и вообще не требуют,
чтобы данные подчинялись какому-то определенному типу
Рис. 3.4. Еще один возможный исход эксперимента с диетой. В трех группах сред- ние примерно равны и только в группе макаронной диеты сердечный выброс явно повысился. Такой результат, как и предыдущий никто не отнесет на счет случайно- сти. И снова разброс выборочных средних превышает разброс внутри групп.
ГЛАВА 3

53
распределения. Более подробно мы рассмотрим непараметри- ческие критерии в гл. 5, 8 и 10. Непараметрические критерии дают более грубые оценки, чем параметрические. Параметри- ческие методы более точны, но лишь в случае, если правильно определено распределение совокупности.
ДВЕ ОЦЕНКИ ДИСПЕРСИИ
Мы уже выяснили, что чем больше разброс средних и чем мень- ше разброс значений внутри групп, тем меньше вероятность того, что наши группы — это случайные выборки из одной со- вокупности. Осталось только оформить это суждение количе- ственно.
Дисперсию совокупности можно оценить двумя способами.
Во-первых, дисперсия, вычисленная для каждой группы, — это
Рис. 3.5. Еще один набор из четырех случайных выборок по семь человек в каждой,
извлеченых из совокупности в 200 человек (население городка, где изучали влияние диеты на сердечный выброс).
СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ

54
оценка дисперсии совокупности. Поэтому дисперсию совокуп- ности можно оценить на основании групповых дисперсий. Та- кая оценка не будет зависеть от различий групповых средних.
Например, для данных на рис. 3.2 и 3.3 она будет одинаковой.
Во-вторых, разброс выборочных средних тоже позволяет оце- нить дисперсию совокупности. Понятно, что такая оценка дис- персии зависит от различий выборочных средних.
Если экспериментальные группы — это четыре случайные выборки из одной и той же нормально распределенной сово- купности (применительно к нашему эксперименту это значило бы, что диета не влияет на сердечный выброс), то обе оценки дисперсии совокупности дали бы примерно одинаковые резуль- таты. Поэтому, если эти оценки оказываются близки, то мы не можем отвергнуть нулевую гипотезу. В противном случае мы отвергаем нулевую гипотезу, то есть, заключаем маловероятно,
что мы получили бы такие различия между группами, если бы они были просто четырьмя случайными выборками из одной нормально распределенной совокупности.
Перейдем к вычислениям. Как оценить дисперсию совокуп- ности по четырем выборочным дисперсиям? Если верна гипо- теза о том, что диета не влияет на величину сердечного выбро- са, то любая из них дает одинаково хорошую оценку. Поэтому в качестве оценки дисперсии совокупности возьмем среднее вы- борочных дисперсий. Эта оценка называется внутригрупповой дисперсией; обозначим ее
2
вну
s .
(
)
2 2
2 2
2
вну кон мак мяс фру
1
,
4
s
s
s
s
s
=
+
+
+
где
2
кон
s ,
2
мак
s ,
2
мяс
s ,
2
фру
s
— выборочные оценки дисперсии в груп- пах, питавшихся как обычно (контроль), макаронами, мясом и фруктами. Дисперсия внутри каждой группы вычисляется от- носительно среднего для группы. Поэтому внутригрупповая дис- персия не зависит от того, насколько различаются эти средние.
Оценим теперь дисперсию совокупности по выборочным сред- ним. Так как мы предположили, что все четыре выборки извлече- ны из одной совокупности, стандартное отклонение четырех выборочных средних служит оценкой ошибки среднего. На-
ГЛАВА 3


55
помним, что стандартная ошибка среднего
X
σ связана со стан- дартным отклонением совокупности
σ и объемом выборки n сле- дующим соотношением:
X
n
σ
σ =
Тем самым, дисперсию совокупности
σ
2
можно рассчитать следующим образом:
2 2
X
n
σ
σ
=
Воспользуемся этим, чтобы оценить дисперсию совокупно- сти по разбросу значений выборочных средних. Эта оценка на- зывается межгрупповой дисперсией, обозначим ее
2
меж
s
2 2
меж
X
s
ns
=
,
где
2
X
s — оценка стандартного отклонения выборки из четырех средних.
Если верна нулевая гипотеза, то как внутригрупповая, так и межгрупповая дисперсии служат оценками одной и той же дис- персии и должны быть приближенно равны. Исходя из этого,
вычислим критерий F:
Дисперсия совокупности,
оцененная по выборочным средним
,
Дисперсия совокупности, оцененная по выборочным дисперсиям
F
=
или
2
меж
2
вну
s
F
s
=
И числитель, и знаменатель этого отношения — это оценки одной и той же величины — дисперсии совокупности
σ
2
, по- этому значение F должно были близко к 1. Для четырех групп,
представленных на рис. 3.2, значение F действительно близко к единице. Теперь наши исследователи влияния диеты на сер- дечный выброс могут сделать определенные выводы. Получен-
СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ

56
ные в эксперименте данные не противоречат нулевой гипотезе,
следовательно, нет оснований, считать, что диета влияет на сердечный выброс. Что касается данных, которые мы специально сконструировали, чтобы убедить читателя в таком «влиянии»
(рис. 3.3), то для них F = 68,0. Для данных, изображенных на рис. 3.4, F = 24,5. Как видим, величина F хорошо согласуется с впечатлением, которое складывается при взгляде на рисунок.
Итак, если F значительно превышает 1, нулевую гипотезу следует отвергнуть. Если же значение F близко к 1, нулевую гипотезу следует принять. Осталось понять, начиная с какой именно величины F следует отвергать нулевую гипотезу.
КРИТИЧЕСКОЕ ЗНАЧЕНИЕ F
Если извлекать случайные выборки из нормально распределен- ной совокупности, значение F будет меняться от опыта к опыту.
Например, на рис. 3.5 представлен еще один набор из четырех случайных выборок по семь человек в каждой, извлеченных из нашей совокупности в 200 человек. На этот раз F = 0,5. Поло- жим, что нам удалось повторить эксперимент с жителями того же городка, скажем, 200 раз. Каждый раз мы заново набирали по четыре группы, и каждый раз вычисляли F. На рис. З.6А при- ведены результаты этого многократного эксперимента. Значе- ния F округлены до одного знака после запятой и изображены кружками. Два черных кружка соответствуют данным с рис. 3.2
и 3.5. Как и следовало ожидать, большинство значений F близко к единице (попадая в интервал от 0 до 2), только в 10 из 200 опы- тов (то есть в 5% случаев) мы получили значение F, большее или равное З. (На рис. 3.6Б эти 10 значений показаны черными круж- ками). Значит, отвергая нулевую гипотезу при F
≥ 3, мы будем ошибаться в 5% случаев. Если такой процент ошибок не чрезме- рен, то будем считать «большими» те значения F, которые боль- ше или равны 3. Значение критерия, начиная с которого мы от- вергаем нулевую гипотезу, называется критическим значением.
Вероятность ошибочно отвергнуть верную нулевую гипотезу,
то есть найти различия там, где их нет, обозначается Р. Как прави- ло, считают достаточным, чтобы эта вероятность не превышала
ГЛАВА 3


57 5%. (Максимальная приемлемая вероятность ошибочно отверг- нуть нулевую гипотезу называется уровнем значимости и обо- значается
α). Почему бы не повысить критическое значение F
тем самым, уменьшая эту вероятность? Однако в этом случае возрастет риск ошибочно принять неверную нулевую гипотезу
(то есть не найти различий там, где они есть). Подробнее мы поговорим об этом в гл. 6.
Итак, мы решили, приняв допустимой 5% вероятность ошиб- ки, отвергать нулевую гипотезу при F > 3. Однако критическое значение F следовало бы выбрать на основе не 200, а всех 10 42
экспериментов, которые можно провести на совокупности из
200 человек. Предположим, что нам удалось провести все эти эксперименты. По их результатам мы вычислили соответству- ющие значения F и нанесли их на график (рис. 3.6В). Здесь каж- дое значение F изображено «песчинкой». На долю темных пес- чинок в правой части горки приходится 5% всех значений. Кар- тина, в общем, похожа на ту, что мы видели рис. 3.6Б. На прак- тике совокупности гораздо больше, чем население нашего го- родка, а число возможных значений F несравненно больше 10 42
Если мысленно увеличить объем совокупности до бесконечно- сти, то песчинки сольются, и получится гладкая кривая, изобра- женная на рис. 3.6Г. Площади под кривой аналогичны долям от общего числа кружков или песчинок на рис. 3.6А, Б и В. Зашт- рихованная область на рис. 3.6Г составляет 5% всей площади под кривой. Эта область начинается от F = 3,01, это и есть кри- тическое значение F.
В нашем примере число групп равнялось 4, в каждую группу входило 7 человек. Если бы число групп или число членов в каж- дой группе было другим, кривая пошла бы по-другому и крити- ческое значение F тоже было бы другим. Вообще, критическое значение F однозначно определяется уровнем значимости (обычно
0,05 или 0,01) и еще двумя параметрами, которые называются внутригрупповым и межгрупповым числом степеней свободы и обозначаются греческой буквой
ν («ню»). Оставим в стороне воп- рос о происхождении этих названии и просто укажем, как их оп- ределять. Межгрупповое число степеней свободы — это число групп минус единица
ν
меж
= m – 1. Внутригрупповое число степе- ней свободы — это произведение числа групп на численность
СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ

58
каждой из групп минус единица
ν
вну
= m (n – 1). В примере с ис- следованием диеты межгрупповое число степеней свободы равно
4 – 1 = 3, а внутригрупповое 4 (7 – 1) = 24. Вычислить критичес- кое значение F довольно сложно, поэтому пользуются таблицами критических значений F для разных
α, ν
меж и
ν
вну.
(табл. 3.1).
Математическая модель, на которой основано вычисление критических значений F предполагает следующее.
• Каждая выборка независима от остальных выборок.
• Каждая выборка случайным образом извлечена из исследуе- мой совокупности.
1   2   3   4   5   6   7   8   9   ...   37

Рис. 3.6. А. Четыре случайные выборки по 7 человек в каждой извлекли из той же сово- купности (население городка) 200 раз. Каждый раз рассчитывали значение F и наноси- ли его на график. Результаты для выборок с рис. 3.2 и 3.5 помечены черным. Б. Десять наибольших значений помечень черньм. Область черных кружков начинается со значе- ния F, равного 3,0.
ГЛАВА 3

59
• Совокупность нормально распределена.
• Дисперсии всех выборок равны.
При существенном нарушении хотя бы одного из этих усло- вий нельзя пользоваться ни таблицей 3.1, ни вообще дисперси- онным анализом.
В рассмотренном нами эксперименте исследовалась зависи- мость только от одного фактора — диеты. Дисперсионный ана-
Рис. 3.6. (продолжение). В. Из той же совокупности извлекли все воэможнье наборы из 4 выборок по 7 человек в каждой и построили распределение F. От- дельные значения слились, превратившись в песчинки. 5% песчинок с самыми большими значениями F помечены черным. Г. Такое распределение F получит- ся, если извлекать выборки из бесконечной совокупности. Пяти процентам са- мых высоких значений F соответствует заштрихованная область (ее площадь составляет 5% от общей площади всей кривой). «Большие» значения F начина- ются там, где начинается эта область, то есть с F = 3,01.
СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ
Г
0 1,0 2,0 3,0 4,0
Значение F

60
Т
аб
лица
3.1.
Критиче ские зна чения
F
для
α
= 0,05 (
обычный шрифт
) и
α
= 0,01 (
жирный шрифт
)
ν
меж
ν
вну
1234 56789 10 11 12 14 16 20 24 30 40 50 75 10 0
20 0
50 0

1 161 199 216 225 230 234 237 239 241 242 243 244 245 246 248 249 250 251 252 253 253 254 254 254
4052
4999
5404
5624
5764
5859
5928
5981
6022
6056
6083
6107
6143
6170
6209
6234
6260
6286
6302
6324
6334
6350
6360
6366
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,42 19,43 19,45 19,45 19,46 19,47 19,48 19,48 19,49 19,49 19,49 19,50
98,50
99,00
99,16
99,25
99,30
99,33
99,36
99,38
99,39
99,40
99,41
99,42
99,43
99,44
99,45
99,46
99,47
99,48
99,48
99,48
99,49
99,49
99,50
99,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,71 8,69 8,66 8,64 8,62 8,59 8,58 8,56 8,55 8,54 8,53 8,53
34,12
30,82
29,46
28,71
28,24
27,91
27,67
27,49
27,34
27,23
27,13
27,05
26,92
26,83
26,69
26,60
26,50
26,41
26,35
26,28
26,24
26,18
26,15
26,13
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91 5,87 5,84 5,80 5,77 5,75 5,72 5,70 5,68 5,66 5,65 5,64 5,63
21,20
18,00
16,69
15,98
15,52
15,21
14,98
14,80
14,66
14,55
14,45
14,37
14,25
14,15
14,02
13,93
13,84
13,75
13,69
13,61
13,58
13,52
13,49
13,46
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,64 4,60 4,56 4,53 4,50 4,46 4,44 4,42 4,41 4,39 4,37 4,37
16,26
13,27
12,06
11,39
10,97
10,67
10,46
10,29
10,16
10,05
9,96
9,89
9,77
9,68
9,55
9,47
9,38
9,29
9,24
9,17
9,13
9,08
9,04
9,02
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,96 3,92 3,87 3,84 3,81 3,77 3,75 3,73 3,71 3,69 3,68 3,67
13,75
10,92
9,78
9,15
8,75
8,47
8,26
8,10
7,98
7,87
7,79
7,72
7,60
7,52
7,40
7,31
7,23
7,14
7,09
7,02
6,99
6,93
6,90
6,88
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57 3,53 3,49 3,44 3,41 3,38 3,34 3,32 3,29 3,27 3,25 3,24 3,23
12,25
9,55
8,45
7,85
7,46
7,19
6,99
6,84
6,72
6,62
6,54
6,47
6,36
6,28
6,16
6,07
5,99
5,91
5,86
5,79
5,75
5,70
5,67
5,65
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,24 3,20 3,15 3,12 3,08 3,04 3,02 2,99 2,97 2,95 2,94 2,93
11,26
8,65
7,59
7,01
6,63
6,37
6,18
6,03
5,91
5,81
5,73
5,67
5,56
5,48
5,36
5,28
5,20
5,12
5,07
5,00
4,96
4,91
4,88
4,86
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,03 2,99 2,94 2,90 2,86 2,83 2,80 2,77 2,76 2,73 2,72 2,71
10,56
8,02
6,99
6,42
6,06
5,80
5,61
5,47
5,35
5,26
5,18
5,1
1
5,01
4,92
4,81
4,73
4,65
4,57
4,52
4,45
4,41
4,36
4,33
4,31
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,86 2,83 2,77 2,74 2,70 2,66 2,64 2,60 2,59 2,56 2,55 2,54
10,04
7,56
6,55
5,99
5,64
5,39
5,20
5,06
4,94
4,85
4,77
4,71
4,60
4,52
4,41
4,33
4,25
4,17
4,12
4,05
4,01
3,96
3,93
3,91
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,74 2,70 2,65 2,61 2,57 2,53 2,51 2,47 2,46 2,43 2,42 2,41
9,65
7,21
6,22
5,67
5,32
5,07
4,89
4,74
4,63
4,54
4,46
4,40
4,29
4,21
4,10
4,02
3,94
3,86
3,81
3,74
3,71
3,66
3,62
3,60
12 4,75 3,89 3,49 3,26 3,1 1
3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,64 2,60 2,54 2,51 2,47 2,43 2,40 2,37 2,35 2,32 2,31 2,30
9,33
6,93
5,95
5,41
5,06
4,82
4,64
4,50
4,39
4,30
4,22
4,16
4,05
3,97
3,86
3,78
3,70
3,62
3,57
3,50
3,47
3,41
3,38
3,36
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,55 2,51 2,46 2,42 2,38 2,34 2,31 2,28 2,26 2,23 2,22 2,21
9,07
6,70
5,74
5,21
4,86
4,62
4,44
4,30
4,19
4,10
4,02
3,96
3,86
3,78
3,66
3,59
3,51
3,43
3,38
3,31
3,27
3,22
3,19
3,17
14 4,60 3,74 3,34 3,1 1
2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53 2,48 2,44 2,39 2,35 2,31 2,27 2,24 2,21 2,19 2,16 2,14 2,13
8,86
6,51
5,56
5,04
4,69
4,46
4,28
4,14
4,03
3,94
3,86
3,80
3,70
3,62
3,51
3,43
3,35
3,27
3,22
3,15
3,1
1
3,06
3,03
3,01
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,42 2,38 2,33 2,29 2,25 2,20 2,18 2,14 2,12 2,10 2,08 2,07
8,68
6,36
5,42
4,89
4,56
4,32
4,14
4,00
3,89
3,80
3,73
3,67
3,56
3,49
3,37
3,29
3,21
3,13
3,08
3,01
2,98
2,92
2,89
2,87
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42 2,37 2,33 2,28 2,24 2,19 2,15 2,12 2,09 2,07 2,04 2,02 2,01
8,53
6,23
5,29
4,77
4,44
4,20
4,03
3,89
3,78
3,69
3,62
3,55
3,45
3,37
3,26
3,18
3,10
3,02
2,97
2,90
2,86
2,81
2,78
2,75