Файл: Книга Primer of biostatistics fourth edition.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.12.2023

Просмотров: 610

Скачиваний: 7

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

326
метрических аналогов (это обстоятельство можно использовать для оценки чувствительности непараметрических критериев и определения необходимого числа наблюдений).
Как выяснить, согласуются ли данные с предположением о нормальности распределения? Простейший способ состоит в том, чтобы нанести их на график, подобный тем, которые мы рисовали, изучая рост инопланетян в гл. 2. Нарисовав график,
прикиньте, похож ли он на нормальное распределение. Та ли у него форма, достаточно ли он симметричен относительно сред- него, покрывает ли интервал, равный плюс-минус двум стан- дартным отклонениям от среднего, практически все наблюде- ния? Сравните графики для разных групп. Близок ли разброс значений? Ответив на все вопросы утвердительно, воспользуй- тесь параметрическим критерием. В противном случае следует использовать непараметрический критерий. Изложенный нехит- рый прием почти наверняка поможет правильно выбрать тип критерия.
Для тех, кто не привык полагаться на зрительные впечатле- ния, укажем еще два способа, иногда более точные и всегда бо- лее трудоемкие. Первый основан на использовании нормальной
вероятностной бумаги. Вы легко поймете, о чем идет речь, если когда-нибудь видели логарифмическую бумагу. Вся разница в том, что на логарифмической бумаге вертикальная ось програ- дуиро-вана так, чтобы графиком экспоненты была прямая, а на нормальной вероятностной бумаге прямой окажется функция нормального распределения. На такую бумагу определенным образом наносят имеющиеся значения. Если они расположатся почти на одной прямой, можно применять параметрические методы. Второй способ опирается на критерий
χ
2
. Он позволяет сравнить реальные данные с теми, которые дало бы нормаль- ное распределение, имеющее то же среднее и дисперсию. Мы не будем останавливаться на этих процедурах*, поскольку их выводы наверняка совпадут с теми, что даст простая прикидка.
Как правило, основная трудность состоит не в том, какой из
* Желающие могут познакомиться с ними по книгам J. H. Zar. Bio-statstical analisys. 2nd ed. Prentice-Hall, Englewood Cliffs, N. J., 1984 и W. J. Dixon, F.
J. Massey, Jr. Introduction to statistical analisys. 4th ed., McGraw-Hill, New
York, 1983.
ГЛАВА 10

327
перечисленных способов выбрать, а в том, что объем выборки слишком мал, чтобы применить любой из них. Убедительные сви- детельства в пользу гипотезы нормальности или против нее встре- чаются редко. Гораздо чаще все решают интуиция, привычка и вкус исследователя. Существуют две точки зрения на то, как сле- дует поступать в таких случаях. Согласно одной, в отсутствие очевидных противоречий между данными и гипотезой их нор- мального распределения следует применить параметрический метод. Согласно другой, если нет явного подтверждения гипоте- зы нормальности распределения, лучше воспользоваться непа- раметрическим методом. Сторонники первой точки зрения упи- рают на то, что параметрические методы более чувствительны и более известны. Приверженцы второй резонно замечают, что исследователь не должен исходить из предположений, которые нельзя проверить, и что, применяя непараметрические критерии,
мы почти ничем не рискуем — ведь даже в случае нормального распределения их чувствительность не намного ниже чувстви- тельности параметрических. Ни одна из сторон пока не одержа- ла верх, и похоже, этого не произойдет никогда.
СРАВНЕНИЕ ДВУХ ВЫБОРОК: КРИТЕРИЙ МАННА—УИТНИ
Напомним схему, по которой строились все параметрические методы, будь то критерий Стьюдента, дисперсионный или кор- реляционный анализ. Из нормально распределенной совокуп- ности мы извлекали все возможные выборки определенного объ- ема и строили распределение значений соответствующего кри- терия. Теперь, упорядочив значения признака и перейдя от ре- альных значений к рангам, мы поступим несколько иначе. Мы просто перечислим все возможные варианты упорядочивания двух групп.
Как это сделать, мы покажем на простом примере. Чтобы ва- риантов упорядочивания было не слишком много, рассмотрим опыт с участием 7 добровольцев. Из них 3 принимают плацебо
(контрольная группа), а 4 препарат, предположительно диуретик
(экспериментальная группа). В табл. 10.1 приведены данные о суточном диурезе. Против каждого значения диуреза указан
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ


328
его ранг — место в общем упорядоченном ряду. Рангом наимень- шей величины будет 1; ранг наибольшей величины равен числу наблюдений, то есть 7. Если препарат увеличивает диурез, то ранги в экспериментальной группе должны быть больше, чем
В
контрольной. Мерой отличия изберем сумму рангов в меньшей из групп и обозначим ее Т. В нашем примере меньшая группа
— контрольная. Соответствующее значение Т равно 9.
Достаточно ли мало значение T, чтобы отклонить гипотезу об отсутствии действия препарата?
Для ответа на этот вопрос рассмотрим совокупность всех воз- можных перестановок. Заметьте, после перехода к рангам нам уже не нужно рассматривать сами исходные величины и сово- купность их возможных значений. Поэтому наши дальнейшие рассуждения полностью применимы к любым двум группам на- блюдений по 3 и 4 наблюдения в каждой.
Итак, нулевая гипотеза — гипотеза об отсутствии влияния препарата на диурез. Если она справедлива, любой ранг может равновероятно оказаться в любой из групп. Чтобы узнать, велика ли вероятность случайно получить перестановку из табл. 10.1,
рассмотрим все возможные перестановки. Понятно, что распреде- лить ранги по двум группам — это то же самое, что набрать ран- ги для одной из групп (оставшиеся автоматически попадут во вто- рую). Тогда, перечислив все варианты выбора 3 рангов из 7, мы тем самым перечислим все варианты распределения семи рангов по двум группам. Число способов по-разному выбрать 3 ранга из
7 равно 35. Все 35 вариантов приведены в табл. 10.2. Крестиком помечены ранги, попадающие в контрольную группу. В правом
1   ...   22   23   24   25   26   27   28   29   ...   37

Таблица 10.1. Эксперимент с диуретиком
Плацебо
Препарат
(контрольная группа)
(экспериментальная группа)
Суточный
Суточный диурез, мл
Ранг диурез, мл
Ранг
1000 1
1400 6
1380 5
1600 7
1200 3
1180 2
1220 4
Т = 9
ГЛАВА 10

329
Таблица 10.2. Варианты разделения 7 рангов на две группы по
3 и 4 ранга
Ранги
Сумма
1 2
3 4
5 6
7
рангов
×××××
×××××
×××××
6
×××××
×××××
×××××
7
×××××
×××××
×××××
8
×××××
×××××
×××××
9
×××××
×××××
×××××
10
×××××
×××××
×××××
8
×××××
×××××
×××××
9
×××××
×××××
×××××
10
×××××
×××××
×××××
11
×××××
×××××
×××××
10
×××××
×××××
×××××
11
×××××
×××××
×××××
12
×××××
×××××
×××××
12
×××××
×××××
×××××
13
×××××
×××××
×××××
14
×××××
×××××
×××××
9
×××××
×××××
×××××
10
×××××
×××××
×××××
11
×××××
×××××
×××××
12
×××××
×××××
×××××
11
×××××
×××××
×××××
12
×××××
×××××
×××××
13
×××××
×××××
×××××
13
×××××
×××××
×××××
14
×××××
×××××
×××××
15
×××××
×××××
×××××
12
×××××
×××××
×××××
13
×××××
×××××
×××××
14
×××××
×××××
×××××
14
×××××
×××××
×××××
15
×××××
×××××
×××××
16
×××××
×××××
×××××
15
×××××
×××××
×××××
16
×××××
×××××
×××××
17
×××××
×××××
×××××
18
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

330
столбце для каждого из вариантов указана величина T — сумма рангов меньшей (контрольной) группы. Если нанести значения
T на график, получится распределение, показанное на рис. 10.1.
Если справедлива нулевая гипотеза, то все сочетания рангов рав- новероятны. Это значит, что если, например, Т = 12 в 5 вариан- тах из 35, то вероятность случайно получить значение T = 12
равна 5/35. Таким образом, на рис. 10.1 изображено распреде- ление значений T в случае справедливости нулевой гипотезы об отсутствии действия препарата. По форме оно напоминает распределение t (рис. 4.5). Однако есть и отличия. Действитель- но, распределение t непрерывно. Оно построено по бесконеч- ной совокупности значений, вычисленных для бесконечного числа выборок из бесконечной нормально распределенной совокупности. Напротив, распределение Т конечно и дискрет- но, то есть имеет ступенчатый вид, принимая значения лишь в конечном числе целочисленных точек.
Глядя на рис. 10.1, легко определить вероятность получить то или иное значение Т при условии справедливости нулевой гипотезы. Например, значения T = 9 и Т = 15 наблюдаются в 3
вариантах, то есть вероятность появления каждой из этих сумм равна 3/15. Вероятность получить значение Т, равное 8 или 16,
составляет 2/35 = 0,057. Будем считать эти значения T крити- ческими. В нашем опыте Т = 9, так что нулевую гипотезу отвер- гнуть мы не можем.
Уровень значимости обычно принимают равным 5% или 1%.
Можно ли установить такой уровень в нашем примере? Оказы- вается, нет. У нас есть всего 13 разных значений Т, поэтому уро- вень значимости может меняться только скачками. Назвав про- извольный уровень значимости
α, мы скорее всего обнаружим,
что нет такого значения Т, которому бы он соответствовал. В
качестве критического берут то значение Т, которому соответ-
Рис. 10.1. 35 возможных сумм рангов для меньшей из групп (см. табл. 10.2).
ГЛАВА 10


331
ствует уровень значимости, наиболее близкий к 1 или 5%. В
нашем примере ближе всего к 5% находится уровень значимос- ти 5,7%, соответствующий Т = 8.
Критические значения критерия Манна— Уитни приведены в табл. 10.3. Столбец критических значений содержит пары чи- сел. Различия статистически значимы, если Т не больше перво- го из них или не меньше второго. Например, когда в одной группе
3 человека, а в другой 6, различия статистически значимы, если
T
≤ 7 или T ≥ 23.
Изложенный вариант критерия известен как T-критерий Ман- на—Уитни*. Порядок его вычисления таков.
• Данные обеих групп объединяют и упорядочивают по возрас- танию. Ранг 1 присваивают наименьшему из всех значений,
ранг 2 — следующему и так далее. Наибольший ранг присваи- вают самому большому среди значений в обеих группах. Если значения совпадают, им присваивают один и тот же средний ранг (например, если два значения поделили 3-е и 4-е места,
обоим присваивают ранг 3,5).
• Для меньшей группы вычисляют Т — сумму рангов ее чле- нов. Если численность групп одинакова, Т можно вычислить для любой из них.
• Полученное значение T сравнивают с критическими значени- ями. Если Т меньше или равно первому из них либо больше или равно второму, то нулевая гипотеза отвергается (разли- чия статистически значимы).
Что делать, если нужной численности групп в таблице не оказалось? Можно самому построить распределение Т. К сожале- нию, с ростом численности групп сделать это становится все труднее. Например, если объем каждой из групп равен 10, то
* Существует еще U-критерий Манна—Уитни, в котором вместо Т вы- числяют U, при этом U = T – n
м
(n
м
+ 1)/2, где n
м
— численность меньшей из групп. Об этом варианте критерия можно прочесть в книге S. Siegel, N. J. Castellan. Nonparametric Statistics for the Behavio- ral Sciences, 2nd ed. McGraw-Hill, N. Y., 1988. Подробный вывод Т- критерия и его связь с U-критерием приведены в книге F. Mosteller,
R. Rourke. Sturdy Statistics: Nonparametrics and Order Statistics,
Addison-Wesley, Reading, Mass., 1973.
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

332
Таблица 10.3. Критические значения критерия (двусторонний вариант) Манна— Уитни
Численность Приблизительный уровень значимости
α
группы
0,05 0,01
Точное
Точное мень- боль-
Критические значе-
Критические значе- шей шей значения ние
α
значения ние
α
3 4
6 18 0,057 5
6 21 0,036 5
7 20 0,071 6
7 23 0,048 6
24 0,024 7
7 26 0,033 6
27 0,017 7
8 25 0,067 8
8 28 0,042 6
30 0,012 4
4 11 25 0,057 10 26 0,026 5
11 29 0,032 10 30 0,016 5
12 28 0,063 6
12 32 0,038 10 34 0,010 7
13 35 0,042 10 38 0,012 8
14 38 0,048 11 41 0,008 8
12 40 0,016 5
5 17 38 0,032 15 40 0,008 5
18 37 0,056 16 39 0,016 6
19 41 0,052 16 44 0,010 7
20 45 0,048 17 48 0,010 8
21 49 0,045 18 52 0,011 6
6 26 52 0,041 23 55 0,009 6
24 54 0,015 7
28 56 0,051 24 60 0,008 7
25 59 0,014 8
29 61 0,043 25 65 0,008 8
30 60 0,059 26 64 0,013 7
7 37 68 0,053 33 72 0,011 8
39 73 0,054 34 78 0,009 8
8 49 87 0,050 44 92 0,010
ГЛАВА 10


333
число вариантов равно 184756. Поэтому лучше воспользовать- ся тем, что при численности групп, большей 8, распределение Т
приближается к нормальному со средним
(
)
м м
б
1 2
T
n n
n
+ +
µ =
и стандартным отклонением
(
)
м б м
б
1
,
12
T
n n n
n
+ +
σ =
где n
м и n
б
— объемы меньшей и большей выборок*.
В таком случае величина
T
T
T
T
z
− µ
=
σ
имеет стандартное нормальное распределение. Это позволяет сравнить z
T
с критическими значениями нормального распре- деления (последняя строка табл. 4.1). Более точный результат обеспечивает поправка Йейтса:
1 2
T
T
T
T
z
− µ −
=
σ
Роды по Лебуайе
В последние десятилетия произошел коренной пересмотр взгля- дов на родовспоможение. Акушерская революция совершалась под лозунгом «Отец вместо седативных средств». Восторже-
* Если некоторые значения совпадают, стандартное отклонение должно быть уменьшено согласно формуле:
(
)
(
)
(
) (
)
м б м б
2 1
1 1 ,
12 12 1
T
i
i
i
n n N
n n
N N
+
σ =

τ − τ τ +


где N = n
м и n
б
— общее число членов обеих выборок,
τ
i
— число значений i-го ранга, а суммирование производится по всем совпадаю- щим рангам.
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

334
ствовала точка зрения, согласно которой при нормальных родах следует прибегать к помощи психологических, а не лекарствен- ных средств. Что делать конкретно, мнения расходились. Мас- ла в огонь подлила книга Лебуайе «Рождение без насилия».
Французский врач предлагал комплекс мер, призванных свести к минимуму потрясение, которое испытывает новорожденный при появлении на свет. Роды надлежит принимать в тихом затем- ненном помещении. Сразу после родов ребенка следует уложить на живот матери и не перерезать пуповину, пока та не переста- нет пульсировать. Затем, успокаивая младенца легким погла- живанием, нужно поместить его в теплую ванну, чтобы «вну- шить, что разрыв с организмом матери — не шок, но удоволь- ствие». Лебуайе указывал, что дети, рожденные по его методи- ке, здоровее и радостнее других. Многие врачи считали, что предложенная методика не только противоречит общепринятой практике, но и создает дополнительную опасность для матери и ребенка. Тем не менее у Лебуайе нашлись и сторонники.
Как часто бывает в медицине, отсутствие достоверных дан- ных могло затянуть спор на многие годы. Пока Н. Нелсон и со- авт.* не провели клиническое испытание, материалы ограни- чивались «клиническим опытом» автора методики.
В эксперименте Нелсон, проведенном в клинике канадского университета Макмастер, участвовали роженицы без показаний к искусственному родоразрешению, срок беременности кото- рых составлял не менее 36 недель и которые были согласны ро- жать как по обычной методике, так и по Лебуайе. Роженицы были случайным образом разделены на две группы. В контроль- ной роды проводились по общепринятой методике в нормально освещенном помещении с обычным уровнем шума; после рож- дения пуповина немедленно перерезалась, ребенка пеленали и отдавали матери. В экспериментальной группе роды принима- лись по методике Лебуайе. В обеих группах при родах присут- ствовали мужья, применение обезболивающих средств было ми-
* N. Nelson, M. Enkin, S. Saigal, К. Bennett, R. Milner, D. Sackett. A
randomized clinical trial of the Leboyer approach to childbirth. N. Engl.
J. Med., 302: 655–660, 1980.
ГЛАВА 10