ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.12.2023
Просмотров: 590
Скачиваний: 7
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
174
ГЛАВА 6
отклонения
σ, n
1
и n
2
— объемы выборок. Заметьте, что
1
X и
2
X — это оценки двух (различных) средних —
µ
1
и
µ
2
. Для про- стоты допустим, что объемы обеих выборок равны, то есть
n
1
= n
2
. Тогда вычисленное значение t есть оценка величины
1 2
1 2
2 2
2
t
n
n
n
µ µ
µ µ
σ
σ
σ
−
−
′ =
=
+
Обозначим
δ (греческая буква «дельта») величину эффекта,
то есть разность средних:
δ = µ
1
–
µ
2
, тогда
2 2
n
t
n
δ
δ
σ
σ
′ =
=
Таким образом, t
′ зависит от отношения величины эффекта к стандартному отклонению.
Рассмотрим несколько примеров. Стандартное отклонение в исследуемой нами совокупности составляет 200 мл (см. рис. 6.1).
В таком случае увеличение суточного диуреза на 200 или 400 мл равно соответственно одному или двум стандартным отклонени- ям. Это очень заметные изменения. Если бы стандартное откло- нение равнялось 50 мл, то те же самые изменения диуреза были бы еще более значительными, составляя соответственно 4 и 8
стандартных отклонений. Наоборот, если бы стандартное откло- нение равнялось, например, 500 мл, то изменение диуреза в 200
мл составило бы 0,4 стандартного отклонения. Обнаружить та- кой эффект было бы непросто да и вряд ли вообще стоило бы.
Итак, на чувствительность критерия влияет не абсолютная величина эффекта, а ее отношение к стандартному отклонению.
Обозначим его
ϕ (греческая «фи»); это отношение ϕ = δ/σ назы- вается параметром нецентральности.
Объем выборки
Мы узнали о двух факторах, которые влияют на чувствитель- ность критерия: уровень значимости
α и параметр нецентраль- ности
ϕ. Чем больше α и чем больше ϕ, тем больше чувстви-
175
ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
тельность. К сожалению, влиять на
ϕ мы не можем вовсе, а что касается
α, то его увеличение повышает риск отвергнуть вер- ную нулевую гипотезу, то есть найти различия там, где их нет.
Однако есть еще один фактор, который мы можем, в определен- ных пределах, менять по своему усмотрению, не жертвуя уров- нем значимости. Речь идет об объеме выборок (численности групп). С увеличением объема выборки чувствительность кри-
терия увеличивается.
Существуют две причины, в силу которых увеличение объе- ма выборки увеличивает чувствительность критерия. Во-пер- вых, увеличение объема выборки увеличивает число степеней свободы, что, в свою очередь, уменьшает критическое значе- ние. Во-вторых, как видно из только что полученной формулы
,
2
n
t
δ
σ
′ =
значение t растет с ростом объема выборки n (это справедливо и для многих других критериев).
На рис 6.7А воспроизведены распределения с рис. 6.4А. Вер- хний график соответствует случаю, когда препарат не обладает диуретическим действием, нижний — когда препарат увеличи- вает суточный диурез на 200 мл. Численность каждой из групп составляет 10 человек. На рис 6.7Б приведены аналогичные рас- пределения. Отличие в том, что теперь в каждую группу входи- ло не 10, а 20 человек. Раз объем каждой из групп равен 20,
число степеней свободы равно
ν = 2(20 – 1) = 38. Из таблицы 4.1
находим, что критическое значение t при 5% уровне значимос- ти равно 2,024 (в случае выборок объемом 10 оно равнялось
2,101). С другой стороны, увеличение объема выборок привело к увеличению значений критерия. В результате уже не 55, а 87%
значений t превышают критическое значение. Итак, увеличе- ние численности групп с 10 до 20 человек привело к повыше- нию чувствительности с 0,55 до 0,87.
Перебирая все возможные объемы выборок, можно постро- ить график чувствительности критерия как функции от числен- ности групп (рис. 6.8). С увеличением объема чувствительность
176
Рис. 6.7. Увеличение объема выборки повышает чувствительность по двум при- чинам. Во-первых, увеличивается число степеней свободы, и критическое зна- чение t уменьшается. Во-вторых, при той же величине различий получаются бо- лее высокие значения t.
ГЛАВА 6
177
ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
растет. Сначала она растет ускоренно, затем, начиная с некото- рого объема выборки, рост замедляется.
Расчет чувствительности — важнейшая составная часть пла- нирования медицинских исследований. Теперь, познакомившись с наиболее важным фактором, определяющим чувствительность,
мы готовы решить эту задачу.
Как определить чувствительность критерия?
На рис. 6.9 чувствительность критерия Стьюдента представле- на как функция от параметра нецентральности
ϕ = δ/σ при уров- не значимости
α = 0,05. Четыре кривые соответствуют четырем объемам выборок.
Подразумевается, что выборки имеют равный объем. Что де- лать, если это не так? Если вы обратились к рис. 6.9 при плани-
ровании исследования (что весьма разумно), то нужно учесть следующее. При заданной общей численности обследованных именно равная численность групп обеспечивает максимальную чувствительность. Значит, равную численность групп и следу- ет запланировать. Если же вы решили рассчитать чувствитель- ность после проведения исследования, когда, не найдя статис- тически-значимых различий, вы хотите определить, в какой сте- пени это можно считать доказательством отсутствия эффекта,
— тогда следует принять численность обеих групп равной мень- шей из них. Такой расчет даст несколько заниженную оценку чувствительности, но убережет вас от излишнего оптимизма.
Применим кривые с рис. 6.9 к примеру с диуретиком (см.
рис. 6.1). Мы хотим вычислить чувствительность критерия Стью- дента при уровне значимости
α = 0,05. Стандартное отклонение равно 200 мл. Какова вероятность выявить увеличение суточного диуреза на 200 мл?
200 1.
200
δ
ϕ
σ
= =
=
Численность контрольной и экспериментальной групп рав- на десяти. Выбираем на рис. 6.9 соответствующую кривую и находим, что чувствительность критерия равна 0,55.
До сих пор мы говорили о чувствительности критерия Стью-
178
Рис. 6.8. Чувствительность критерия Стьюдента как функция от объема выбо- рок при величине различий 200 мл, уровне значимости
α = 0,05 и стандартном отклонении
σ = 200 мл. При объеме выборок 10 человек чувствительность со- ставляет 0,55.
ГЛАВА 6
179
ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
дента. Можно рассчитать чувствительность и других критери- ев. Определяется она теми же самыми факторами, но ход вы- числений будет несколько иным.
Галотан и морфин при операциях на открытом сердце
В гл. 4 мы сравнили сердечный индекс при галотановой и морфиновой анестезии (см. табл. 4.2) и не нашли статисти- чески значимых различий. (Напомним, что сердечный индекс
— это отношение минутного объема сердца к площади по- верхности тела.) Однако группы были малы — 9 и 16 чело- век. Средняя величина сердечного индекса в группе галотана равнялась 2,08 л/мин/м
2
; в группе морфина 1,75 л/мин/м
2
, то есть на 16% меньше. Даже если бы различия были статисти- чески значимыми, вряд ли столь небольшая разница представ- ляла бы какой-либо практический интерес.
Поэтому поставим вопрос так: какова была вероятность вы- явить разницу в 25%? Объединенная оценка дисперсии s
2
= 0,89,
значит, стандартное отклонение равно 0,94 л/мин/м
2
. Двадцать пять процентов от 2,08 л/мин/м
2
— это 0,52 л/мин/м
2
Тем самым,
0,52 0,553.
0,94
δ
ϕ
σ
= =
=
Поскольку численности групп не совпадают, для оценки чув- ствительности выберем меньшую из них — 9. Из рис. 6.9 сле- дует, что в таком случае чувствительность критерия — 0,16.
Шансы выявить даже 25% различия были весьма малы.
Подведем итоги.
• Чувствительность критерия есть вероятность отвергнуть лож- ную гипотезу об отсутствии различий.
• На чувствительность критерия влияет уровень значимости:
чем меньше
α, тем ниже чувствительность.
• Чем больше величина эффекта, тем больше чувствитель- ность.
• Чем больше объем выборки, тем больше чувствительность.
• Для разных критериев чувствительность вычисляется по-раз- ному.
180
ГЛАВА 6
Рис. 6.9. Чувствительность критерия Стьюдента в зависимости от параметра не- центральности
ϕ при уровне значимости α = 0,05 для разных объемов выборок n.
Параметр нецентральности — это отношение величины различий к стандартному отклонению в совокупности:
ϕ = δ/σ. Пунктирные линии показывают, как пользо- ваться графиками. Если, например, величина различий
δ = 200 мл, стандартное отклонение
σ = 200 мл, то ϕ = 1. Для объема выборок n = 10 чувствительность составляет 0,55. При
ϕ = 0,55 и n = 9 чувствительность — всего лишь 0,16.
181
* Во вводном курсе этот раздел можно пропустить без ущерба для понимания последующего материала.
** Численность групп предполагается равной. Как и в случае критерия
Стьюдента, именно равная численность групп обеспечивает макси- мальную чувствительность при заданной общей численности обсле- дованных.
ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
ЧУВСТВИТЕЛЬНОСТЬ ДИСПЕРСИОННОГО АНАЛИЗА
Чувствительность дисперсионного анализа* определяется теми же факторами, что чувствительность критерия Стьюдента, по- хож и способ ее вычисления. Для расчета нам понадобятся сле- дующие данные: число групп, их численность, уровень значи- мости и величина различий. Что понимать под величиной раз- личий, если число групп больше двух? В качестве величины различий
δ используют минимальную величину различий меж- ду любыми двумя группами. Параметр нецентральности рас- считывают по формуле:
,
2
n
k
δ
ϕ
σ
=
где
σ — стандартное отклонение в совокупности, k — число групп, n — численность каждой из них**. Есть другой способ,
несколько более сложный. Если
µ
i
, — среднее в i-й труппе, то
(
)
2 2
,
i
k
µ µ
ϕ
σ
−
=
∑
где
i
k
µ
µ =
∑
есть среднее по всем группам.
Определив параметр нецентральности, и зная межгрупповое число степеней свободы
ν
меж
= k – 1, чувствительность находят по графикам, где она представлена как функция от параметра нецентральности. На рис. 6.10 изображены графики для
ν
меж
= 2,
графики для других значений
ν
меж вы найдете в приложении Б.
182
Те же графики можно использовать и для определения чис- ленности групп, обеспечивающей необходимую чувствитель- ность. Это сложнее, чем в случае критерия Стьюдента, так как теперь n входит и в параметр нецентральности
ϕ, и в выражение для числа степеней свободы
ν
вну
. Поэтому значение n приходится подбирать путем последовательного приближения. Сначала вы произвольно выбираете начальное значение n и вычисляете чув- ствительность. В зависимости от найденного значения чувстви- тельности вы изменяете n, после чего повторяете вычисление.
Эта процедура повторяется до тех пор, пока значение чувстви- тельности не окажется достаточно близким к нужному.
БЕГ И МЕНСТРУАЦИИ
Чтобы получше разобраться с тем, как вычислить чувствитель- ность и объем выборки при дисперсионном анализе, обратимся к примеру с влиянием бега на частоту менструаций, который мы разбирали в гл. 3 (рис. 3.9). Сейчас нас интересует, какова вероят- ность выявить различие в одну менструацию в год (
δ = 1). Число групп k = 3; стандартное отклонение
σ = 2. Численность каждой из групп n = 26. Уровень значимости выбираем:
α = 0,05. Найдем параметр нецентральности:
1 26 1,04.
2 2 3
ϕ =
=
×
Межгрупповое число степеней свободы
ν
меж
= k – 1 = 3 – 1 = 2
и внутригрупповое
ν
вну
= k(n – 1) =3(26 – 1) = 75. По рис. 6.10
находим, что чувствительность составит около 0,30.
Результат обескураживающий, что вообще характерно для рас- четов чувствительности. Положим, нам хотелось бы иметь чув- ствительность равной 0,80. Какая численность групп нужна для этого? В том, что объем n = 26 слишком мал, мы только что убе- дились. Из рис. 6.10 мы видим, что параметр нецентральности должен быть приблизительно равен 2. Для n = 26 он близок к 1.
Значит, численность групп должна быть такой, чтобы параметр нецентральности увеличился вдвое. При вычислении
ϕ из чис- ленности групп n извлекается квадратный корень, поэтому чиc-
ГЛАВА 6
183
ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ
1 ... 11 12 13 14 15 16 17 18 ... 37
Рис. 6.10. Чувствительность дисперсионного анализа как функция от парамет- ра нецентральности
ϕ при уровне значимости α = 0,05 и межгрупповом числе степеней свободы
ν
меж
= 2. В приложении Б вы найдете аналогичные графики для других значений
α и ν
меж
E. S. Pearson, H. O. Hartley. Charts for power function for analysis of variance tests, derived from the non-central F distribution. Biometrika, 38:112–130, 1951
184
ленность групп должна увеличиться в 2 2
= 4 раза. Таким обра- зом, нужно, чтобы в каждую из групп входило по 100 человек.
Тогда
1 100 2,04 2 2 3
ϕ =
=
×
и
ν
вну
= k(n – 1) = 3(100 – 1) = 297. По рис. 6.10 находим, что в этом случае чувствительность составит 0,88, то есть даже боль- ше, чем мы хотели. Поскольку стандартное отклонение может оказаться больше, чем мы думали, некоторый избыток чувстви- телности нам не помешает, однако резонно спросить, где же и на какие средства мы наберем такие группы. Нельзя ли хоть не- много сократить их численность? Попробуем n = 75. Тогда
1 75 1,77 2 2 3
ϕ =
=
×
и
ν
вну
= 3(75 – 1) = 222 . Рис. 6.10 показывает, что теперь чув- ствительность равна 0,80.
Таким образом, для того чтобы при уровне значимости
α = 0,05 с вероятностью 80% обнаружить в трех группах разли- чие в одну менструацию в год, когда стандартное отклонение пред- положительно составляет 2 менструации в год, нужно набрать группы по 75 человек.
ЧУВСТВИТЕЛЬНОСТЬ ТАБЛИЦ СОПРЯЖЕННОСТИ*
Графиками с рис. 6.10 (и из приложения Б) можно воспользоваться для нахождения чувствительности и объема выборки при работе с таблицами сопряженности**. Сначала нужно решить, какое ми- нимальное различие вы хотели бы обнаружить. В случае таблиц сопряженности это означает, что вам нужно заполнить клетки не-
* Во вводном курсе этот раздел можно опустить.
** Таблицу сопряженности 2
×
2 можно рассматривать как задачу сравнения двух долей. Как в этом случае вычислить чувствительность и объем вы- борки, вы поймете, решив задачу 6.6. Более подробно этот вопрос изло- жен в работе: A. F Feinstem. Clinical biostatistics. Mosby, St. Louis, 1977.
ГЛАВА 6
185
Таблица 6.2. Обозначения, используемые при вычислении чув- ствительности критерия
χ
2
p
11
p
12
R
1
p
21
p
22
R
2
p
31
p
32
R
3
C
1
С
2 1,00
которыми долями. В таблице 6.2 приведены обозначения, ис- пользуемые при вычислении чувствительности таблицы сопря- женности, для примера взята таблица 3
×2. Здесь р
ij
— доля в i-й строке j-го столбца, например р
11
— доля всех наблюдений в левой верхней клетке, p
12
— доля наблюдений в правой верхней клетке, и так далее. Сумма всех долей составляет 1. Суммы по строкам обозначаются R
i
, по столбцам — С
j
. Параметр нецент- ральности задается формулой
(
)(
)
(
)
2
,
1 1
1
ij
i
j
i
j
p
R C
N
r
c
R C
ϕ
−
=
−
− +
∑
где r — число строк, с — число столбцов и N — общее число наблюдений. Зная значение
ϕ и число степеней свободы ν
вну
=
∞
и
ν
меж
= (r – 1)(с – 1), чувствительность можно определить по кривым с рис. 6.10.
Для нахождения объема выборки, при котором достигается тре- буемая чувствительность, воспользуемся обратной процеду- рой. Именно, сначала по рис. 6.10 найдем значение параметра не- центральности
ϕ для заданной чувствительности и числа степеней свободы
ν
меж
= (r – 1)(с – 1) и
ν
вну
=
∞. А теперь найдем объем вы- борки, разрешив приведенную выше формулу относительно N:
(
)(
)
(
)
2 1
1 1
ij
i
j
i
j
r
c
N
p
R C
R C
ϕ
−
− +
=
−
∑
Бег и менструации
Дейл и соавт. изучали не только то, как занятия бегом влияют на частоту менструаций, но и то, какая доля женщин обращалась к
ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ