ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.12.2023
Просмотров: 564
Скачиваний: 7
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
345
щего нас показателя. Можно ли считать распределение изме- нения нормальным? При большом желании да, но следует все же признать, что для суждения о типе распределения данных слишком мало. Смущает и «выскакивающее» значение 27% —
оно наводит на мысль о возможной асимметрии распределения.
В подобных случаях лучше не рисковать и воспользоваться не- параметрическим критерием. Применим критерий Уилкоксона.
Выпишем абсолютные величины изменений в порядке воз- растания. Полученные ранги приведены в пятом столбце табл.
10.8, а шестой столбец содержит те же ранги, но со знаками,
соответствующими направлению изменения. Сумма знаковых
Рис. 10.4. Изменение агрегации тромбоцитов после выкуривания сигареты. Вряд ли мы имеем дело с нормальным распределением, об этом свидетельствует, в час- тности, «выпадающее» значение 27%. В таких случаях непараметрические мето- ды, например критерий Уилкоксона, предпочтительнее параметрических, таких,
как критерий Стьюдента.
Таблица 10.8. Агрегация тромбоцитов до и после сигареты выкуривания
Участ- До
После
Измене- Ранг изме- Знаковый ранг ник курения курения ние нения изменения
1 25 27 2
2 2
2 25 29 4
3,5 3,5 3
27 37 10 6
6 4
44 56 12 7
7 5
30 46 16 10 10 6
67 82 15 8,5 8,5 7
53 57 4
3,5 3,5 8
53 80 27 11 11 9
52 61 9
5 5
10 60 59
–1 1
–1 11 28 43 15 8,5 8,5
W = 64
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
346
рангов W = 2 + 3,5 + 6 + 7 + 10 + 8,5 + 3,5 + 11 + 5 + (–l) + 8,5 = 64.
В табл. 10.7 находим 1,8% критическое Значение для суммы ран- гов. Оно равно 52, то есть меньше полученного нами. Поэтому мы признаем изменение агрегации тромбоцитов статистически значимым (Р < 0,018).
СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП:
КРИТЕРИЙ КРУСКАЛА-УОЛЛИСА
В гл. 3 была рассмотрена задача сравнения нескольких выбо- рок. Эта задача возникает, например, когда нужно определить,
одинаково ли эффективны несколько методов лечения, каждый из которых испытывается на отдельной группе. Предполагалось,
что данные, полученные для каждой из групп, подчиняются нор- мальному распределению, причем дисперсии по всем группам примерно одинаковы. На этом допущении и основан изложен- ный в гл. 3 однофакторный дисперсионный анализ. Сейчас мы познакомимся с его непараметрическим аналогом, не. требую- щим предположения о нормальности распределения. Это кри- терий Крускала—Уоллиса.
Критерий Крускала—Уоллиса представляет собой обобще- ние критерия Манна—Уитни. Сначала все значения, независимо от того, какой выборке они принадлежат, упорядочивают по воз- растанию. Каждому значению присваивается ранг — номер его места в упорядоченном ряду. (Совпадающим значениям при- сваивают общий ранг, равный среднему тех мест, которые эти величины делят между собой в общем упорядоченном ряду.)
Затем вычисляют суммы рангов, относящихся к каждой группе,
и для каждой группы определяют средний ранг. При отсутствии межгрупповых различий средние ранги групп должны оказать- ся близки. Напротив, если существует значительное расхожде- ние средних рангов, то гипотезу об отсутствии межгрупповых различий следует отвергнуть. Значение критерия Крускала—
Уоллиса H и является мерой такого расхождения средних рангов.
Для простоты положим, что групп всего три. Обобщение на большее число групп получится автоматически. Имеются ре- зультаты измерения некоторого признака в трех группах. Чис-
ГЛАВА 10
347
ленность групп — n
1
, n
2
и n
3
. Значения объединим, упорядочим и каждому присвоим ранг. Вычислим сумму рангов для каждой группы — R
1
, R
2
и R
3
.Найдем средние ранги:
1 1
1 2
2 2
,
R
R n R
R n
=
=
и
3 3
3
R
R n
=
Общее число наблюдений N = n
1
+ n
2
+ n
3
. Для объединенной группы рангами являются числа 1,2, ..., N и общая сумма рангов равна
(
)
(
)
1 1 2 1
2
N N
N
N
+
+ + +
− + =
…
Тогда средний ранг R для объединенной группы равен
1 2 1
2
N
N
R
N
+ +
+
+
=
=
…
Теперь найдем величину D, равную
(
)
(
)
(
)
2 2
2 1
1 2
2 3
3
D
n R
R
n R
R
n R
R
=
−
+
−
+
−
Это прямой аналог межгрупповой вариации, знакомой нам по гл. 9. Величина D зависит от размеров групп. Чтобы полу- чить показатель, отражающий их различия, следует поделить D
на N(N +1)/12. Полученная величина
(
)
(
)
(
)
2
м м
12 1 12 1
D
H
n R
R
N N
N N
=
=
−
+
+
∑
является значением критерия Крускала—Уоллиса. Суммирова- ние в приведенной формуле производится по всем группам.
Как найти критическое значение Н? Можно было бы просто перечислить все сочетания рангов, как это делалось для кри- териев Манна—Уитни и Уилкоксона. Однако сделать это до- вольно трудно — число вариантов слишком велико. К счастью,
если группы не слишком малы, распределение H хорошо при- ближается распределением
χ
2
с числом степеней свободы
ν =
= k – 1, где k — число групп. Тогда для проверки нулевой гипо- тезы нужно просто вычислить по имеющимся наблюдениям зна- чение Н и сравнить его с критическим значением
χ
2
из табл. 5.7.
В случае трех групп приближение с помощью
χ
2
пригодно, если численность каждой группы не меньше 5. Для четырех групп —
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
348
если общее число наблюдений не менее 10. Но если группы со- всем малы, не остается ничего, кроме как обратиться к таблице точных значений распределения Крускала—Уоллиса (мы не приводим эту таблицу из-за ее громоздкости).
Итак, чтобы выяснить, одинаково ли действие нескольких методов лечения, каждый из которых испытывается на отдель- ной группе, нужно проделать следующее.
• Объединив все наблюдения, упорядочить их по возрастанию.
Совпадающим значениям ранги присваиваются как среднее тех мест, которые делят между собой эти значения*.
• Вычислить критерий Крускала—Уоллиса Н.
• Сравнить вычисленное значение Н с критическим значени- ем
χ
2
для числа степеней свободы, на единицу меньшего числа групп. Если вычисленное значение Н окажется больше кри- тического, различия групп статистически значимы.
Приведем пример использования критерия Крускала—Уоллиса.
Влияние пероральных контрацептивов на выведение
кофеина
Ряд лекарственных средств и пищевых продуктов (кофе, чай и прохладительные напитки) содержат кофеин. Беременным не сле- дует увлекаться крепким кофе, поскольку кофеин может оказать неблагоприятное влияние на плод, а выведение кофеина у бере- менных замедлено. Существует предположение, что замедлен- ное выведение кофеина обусловлено высоким уровнем половых гормонов во время беременности. Р. Патвардан и соавт.** реши- ли косвенно подтвердить это предположение, определив скорость
* При большом числе совпадающих рангов значение H следует поделить на
(
) (
)
(
)
2 1
1 1
1
i
i
i
N N
−
+
−
−
∑
,
τ
τ τ
где N — число членов всех групп,
τ
i
— как обычно, число рангов в i-й связке, а суммирование производится по всем связкам.
** R. Patwardhan, P. Desmond, R. Johnson, S. Schenker. Impaired elimination of caffeine by oral contraceptives. J. Lab. Clin. Med., 95:603—608, 1980.
ГЛАВА 10
349
выведения кофеина у женщин, принимающих пероральные кон- трацептивы. (При приеме пероральных контрацептивов уровень эстрогенов и прогестагенов в крови повышается — то же самое происходит и при беременности.)
Скорость выведения кофеина (как и других веществ) непо- стоянна — она прямо пропорциональна его концентрации в пла- зме. Поэтому нет смысла измерять скорость выведения, скажем,
в миллиграммах в минуту. Вместо этого используют период по- лувыведения (T
1/2
) — время уменьшения концентрации вдвое:
после того как вещество всосется и поступит в кровь, эта вели- чина остается постоянной, пока вещество не будет почти пол- ностью выведено из организма.
T
1/2
определили у женщин, принимающих и не принимаю- щих пероральные контрацептивы, а также у мужчин. Числен- ность групп составила соответственно 9, 9 и 13 человек. Каж-
Таблица 10.9. Период полувыведения кофеина
Женщины
Не принимающие
Принимающие пероральных пероральные
Мужчины контрацептивов контрацептивы
T
1/2
, ч
Ранг
T
1/2
, ч
Ранг
T
1/2
, ч
Ранг
2,04 1
5,30 12 10,36 25 5,16 10 7,28 19 13,28 29 6,11 15 8,98 21 11,81 28 5,82 14 6,59 16 4,54 6
5,41 13 4,59 8
11,04 26 3,51 4
5,17 11 10,08 24 3,18 2
7,25 18 14,47 31 4,57 7
3,47 3
9,43 23 4,83 9
7,60 20 13,41 30 11,34 27 3,79 5
9,03 22 7,21 17
Сумма рангов
146 128 222
Средний ранг
11,23 14,22 24,67
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
350
дый участник эксперимента принимал 250 мг кофеина, что со- ответствует примерно 3 чашкам кофе, после чего дважды опре- деляли концентрацию кофеина в крови и рассчитывали T
1/2
. Ре- зультаты представлены в табл. 10.9.
Общий средний ранг
1 2 31 1
31 1 16 31 2
2
N
R
+ +
+
+
+
=
=
=
=
…
Вычисляем взвешенную сумму квадратов отклонений сред- них по группам от общего среднего
D = 13(11,23 – 16)
2
+ 9(14,22 – 16)
2
+ 9(24,67 – 16)
2
= 1000,82
и значение критерия Крускала—Уоллиса
(
)
(
)
12 12 1000 82 12 107 1
31 31 1
H
D
N N
=
=
=
+
+
,
,
По табл. 5.7 находим 1% критическое значение
χ
2
с числом степеней свободы
ν = k – l = 3 – l = 2. Оно равно 9,210, то есть меньше полученного нами. Таким образом, различия групп ста- тистически значимы (Р < 0,01).
Непараметрическое множественное сравнение
Потребность во множественном сравнении возникает всякий раз,
когда с помощью дисперсионного анализа (или его непа- раметрического аналога — критерия Крускала—Уоллиса) обна- руживается различие нескольких выборок. В этом случае и тре- буется установить, в чем состоит это различие. В гл. 4 мы по- знакомились с параметрическими методами множественного сравнения. Они позволяют сравнить группы попарно и затем объединить их в несколько однородных наборов так, что раз- личия между группами из одного набора статистически незна- чимы, а между группами из разных наборов — значимы. Кроме того, они позволяют сравнить все группы с контрольной.
К счастью, параметрические методы множественного срав- нения легко преобразовать в непараметрические. Когда объемы выборок равны, для множественного сравнения используют не-
ГЛАВА 10
351
параметрические варианты критериев Ньюмена—Кейлса и Дан- нета. Когда же объемы выборок различны, применяется крите- рий Данна. Опишем вкратце эти методы.
Начнем с критериев для выборок равного объема. Критерии
Ньюмена—Кейлса и Даннета совпадают практически полнос- тью, поскольку критерий Даннета есть просто вариант крите- рия Ньюмена—Кейлса для сравнения всех выборок с одной кон- трольной.
Формула для непараметрического варианта критерия Нью- мена—Кейлса:
(
)
2 1
12
A
B
R
R
q
n l nl
−
=
+
,
где R
A
R
B
— суммы рантов двух сравниваемых выборок, п —
объем каждой выборки, l — интервал сравнения. Вычисленное
q сравнивается с критическим значением в табл. 4.3 для беско- нечного числа степеней свободы.
Значение непараметрического критерия Даннета определя- ется формулой:
(
)
кон
1 6
A
R
R
q
nl l
−
′ =
+
,
где R
кон
, — сумма рангов контрольной выборки, а остальные ве- личины те же, что в Критерии q. Уточним только, что l — число всех выборок, включая контрольную. Значение q
′ сравнивается с критическим значением для бесконечного числа степеней сво- боды (табл. 4.4).
Наконец, для сравнения выборок разного объема использу- ется критерий Данна. Впрочем, ничто не мешает применить его и к выборкам одинакового объема. Значение критерия Данна:
(
)
1 1
1 12
A
B
A
B
R
R
Q
N N
n
n
−
=
+
+
,
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
352
где
A
R и
B
R — средние ранги двух сравниваемых выборок, п
A
и п
B
— их объемы, а N — общий объем всех сравниваемых выборок.
Критические значения Q приведены в табл. 10.10. «Стягива- ющее» сравнение проводится как в критерии Ньюмена—Кейлса.
Критерием Данна можно воспользоваться и для сравнения с контрольной выборкой. Приэтом формула для Q остается преж- ней, только критические значения находятся уже по табл. 10.11.
1 ... 24 25 26 27 28 29 30 31 ... 37
Таблица 10.17. Попарные сравнения
Разность
Критичес-
Сравне- сумм кое значе- ние рангов
l
q
ние q
P < 0,05 2 и 6 53 – 10 = 43 6
7,268 4,030
Да
2 и 4 53 – 20 = 33 5
6,600 3,858
Да
2 и 3 53 – 39 = 14 4
3,430 3,633
Нет
2 и 5 53 – 44 = 9 3
Нет
2 и 1 53 – 44 = 9 2
Нет
1 и 6 44 – 10 = 34 5
6,800 3,858
Да
1 и 4 44 – 20 = 24 4
5,879 3,633
Да
1 и 3 44 – 39 = 5 3
1,581 3,314
Нет
1 и 5 44 – 44 = 0 2
Нет
5 и 6 44 – 10 = 34 4
8,329 3,633
Да
5 и 4 44 – 20 = 24 3
7,590 3,314
Да
5 и 3 44 – 39 = 5 2
2,236 2,772
Нет
3 и 6 39 – 10 = 29 3
9,171 3,314
Да
3 и 4 39 – 20 = 19 2
8,497 2,772
Да
4 и 6 20 – 10 = 10 2
4,472 2,772
Да
ГЛАВА 10
365
нениях. Если распределение все же оказывается нормальным,
то при этом происходит некоторое снижение чувствительнос- ти. Однако если распределение отлично от нормального,
непараметрические методы чувствительнее параметрических.
Обратите внимание, что, оперируя не данными, а рангами,
рассмотренные методы строятся, в сущности, по тому же прин- ципу, что и рассмотренные ранее пераметрические, такие, как критерий Стьюдента и дисперсионный анализ. Заменив данные рангами, мы делаем следующее.
• Формулируем нулевую гипотезу, то есть предполагаем, что наблюдаемые различия случайны.
• Выбираем критерий, то есть числовое выражение различий.
• Определяем, каким было бы распределение величины кри- терия при условии справедливости нулевой гипотезы.
• Находим критическое значение, то есть величину, которую при справедливости нулевой гипотезы значение критерия превышает достаточно редко (точнее, с вероятностью, рав- ной уровню значимости
α).
• Вычисляем значение критерия для наших данных и сравниваем его с критическим: если вычисленное значение больше, при- знаем различия статистически значимыми. Выбор между па- раметрическими и непараметрическими методами определя- ется прежде всего характером данных. Имея дело с порядко- выми признаками, не остается ничего, кроме как воспользо- ваться непараметрическими методами. Если признак число- вой, стоит подумать, нормально ли его распределение. Тут могут помочь как общие соображения, так и графическое пред- ставление данных. Даже если нет веских оснований сомне- ваться в нормальности распределения, но данных мало, или вы не хотите делать никаких предположений о типе распреде- ления — воспользуйтесь непараметрическими методами.
ЗАДАЧИ
10.1 Анализы, инструментальные исследования и лекарст- венные средства назначает врач, а платит за них главным об- разом больной. Многие врачи весьма смутно представляют себе
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ