Файл: Книга Primer of biostatistics fourth edition.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.12.2023

Просмотров: 575

Скачиваний: 7

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

295
значений относительно групповых средних с разбросом самих групповых средних. Если разброс средних значительно превы- шал разброс значений, мы отвергали нулевую гипотезу. В качес- тве показателя разброса мы использовали дисперсию. Диспер- сию можно определить как сумма квадратов отклонений, делен- ную на число степеней свободы. Теперь показателем разброса будет служить сама сумма квадратов отклонений*, которую мы будем называть вариацией. Основываясь на вариации, мы повто- рим построение дисперсионного анализа. Перспектива второй раз разбирать уже знакомый метод не слишком вдохновляет, од- нако мы будем вознаграждены: новый взгляд позволит нам пе- рейти к дисперсионному анализу повторных измерений.
В гл. 3 мы рассмотрели такой пример. Чтобы выяснить, влия- ет ли питание на сердечный выброс, из 200 обитателей городка были случайным образом выбраны четыре группы по семь чело- век в каждой. Члены первой (контрольной) группы продолжали питаться как обычно, членам второй группы пришлось есть одни макароны, третьей — мясо, а четвертой — фрукты. Эксперимент длился ровно месяц, после чего у каждого участника был изме-
* Такой подход мы уже использовали в гл. 8 при рассмотрении регрес- сионного анализа.
Таблица 9.1. Сердечный выброс, л/мин
Группа
Контрольная
Макароны Мясо
Фрукты
4,6 4,6 4,3 4,3 4,7 5,0 4,4 4,4 4,7 5,2 4,9 4,5 4,9 5,2 4,9 4,9 5,1 5,5 5,1 4,9 5,3 5,5 5,3 5,0 5,4 5,6 5,6 5,6
Среднее
4,96 5,23 4,93 4,80
Вариация 0,597 0,734 1,294 1,200
Среднее по всем группам = 4,98
Общая вариация = 4,51
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ

296
рен сердечный выброс. Как видно из рис. 3.1, диета не влияет на величину сердечного выброса. Экспериментальные группы — это просто четыре случайные выборки из нормально распреде- ленной совокупности. Однако рис. 3.1 недоступен исследовате- лю, в распоряжении которого есть только данные об участни- ках эксперимента. Эти данные представлены на рис. 3.2 и в табл.
9.1. Как видим, группы все же различаются по средней величи- не сердечного выброса. Можно ли объяснить эти различия случайностью?
Новые обозначения
Прежде чем двигаться дальше, введем новые обозначения (табл.
9.2). Отвлечемся от фруктов и макарон и вообще специфики рассматриваемого эксперимента. Перенумеруем группы от 1 до
4. Участников исследования также перенумеруем и впредь бу- дем называть больными (хотя применительно к данному слу- чаю это не совсем удачно). Значения признака (в данном случае это сердечный выброс) обозначим Х
гб
, например Х
25
значение у 5-го больного 2-й группы. Средние по группам обозначим г
X ,
например
3
X
среднее по 3-й группе. Под средними в таблице мы видим групповые вариации S
г
суммы квадратов отклоне- ний от среднего по группе:
(
)
2
г гб г
б
S
X
X
=


Значок «б» под символом суммы означает, что мы суммиру- ем значения для всех больных данной группы. Для примера рас- считаем вариацию для 1-й группы:
(
)
2 1

1
б
S
X
X
=

=

=(4,6 – 4,96)
2
+ (4,7 – 4,96)
2
+ (4,7 – 4,96)
2
+ (4,9 – 4,96)
2
+
+(5,1 – 4,96)
2
+ (5,3 – 4,96)
2
+ (5,4 – 4,96)
2
= 0,597.
Вспомним определение выборочной дисперсии:
(
)
2 2
,
1
X
X
s
n

=


ГЛАВА 9


297
где п — объем выборки. В числителе стоит сумма квадратов от- клонений от выборочного среднего, то есть вариация. Тем са- мым
2 1
S
s
n
=

Следовательно, выборочную дисперсию для группы можно записать как
2
г г
,
1
S
s
n
=

где п — численность группы. Если все выборки извлечены из одной совокупности, оценкой ее дисперсии можно взять сред- нее выборочных дисперсий. Такая оценка называется внутприг-
рупповой дисперсией:
(
)
2 2
2 2
2
вну
1 2
3 4
1
,
s
s
s
s
s
m
=
+ + +
где m — число групп, в данном случае равное 4. Заменим теперь
Таблица 9.2. Обозначения однофакторного дисперсионного ана- лиза
Группа
1 2
3 4
Х
11
Х
21
Х
31
Х
41
Х
12
Х
22
Х
32
Х
42
Х
13
Х
23
Х
33
Х
43
Х
14
Х
24
Х
34
Х
44
Х
15
Х
25
Х
35
Х
45
Х
16
Х
26
Х
36
Х
46
Х
17
Х
27
Х
37
Х
47
Среднее г
X
1
X
2
X
3
X
4
X
Вариация S
г
(
)
2 1б
1
б
X
X


(
)
2 2б
2
б
X
X


(
)
2 3б
3
б
X
X


(
)
2 4б
4
б
X
X


Среднее по всем группам X
Общая вариация
(
)
2
гб г
б
X
X

∑∑
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ

298
каждую выборочную дисперсию ее выражением через вариа- цию:
2 3
1 2
4
вну
1
,
1 1
1 1
S
S
S
S
s
m n
n
n
n


=
+
+
+








где n — численность каждой из групп. Перенесем n – 1 под дроб- ную черту:
2 1
2 3
4
вну
1 1
S
S
S
S
s
m
n
+
+ +
=

В числителе — сумма вариаций по всем группам. Назовем ее внутригрупповой вариацией и обозначим S
вну
. Обратите внима- ние, что внутригрупповая вариация — это сумма квадратов от- клонений от групповых средних, поэтому она не зависит от того,
различаются эти средние или нет.
В примере с диетой и сердечным выбросом
S
вну
= 0,597 + 0,734 + 1,294 + 1,200 = 3,825.
Перепишем еще раз формулу для внутригрупповой диспер- сии:
(
)
вну
2
вну
1
S
s
m n
=

В знаменателе теперь стоит выражение, знакомое нам по гл. 3.
Это внутригрупповое число степеней свободы:
ν
вну
= m(n – 1). В
рассматриваемом примере
ν
вну
= 4(7 – 1) = 24. Таким образом,
внутригрупповую дисперсию можно выразить через внугригруп- повую вариацию и внутригрупповое число степеней свободы:
вну
2
вну вну
S
s
=
ν
По данным из табл. 9.1 находим
2
вну
3,825 0,159.
24
s
=
=
Как нам известно из гл. 3, чтобы вычислить F, помимо внут-
ГЛАВА 9


299
ригрупповой нужна межгрупповая дисперсия. Внутригруппо- вую дисперсию нам удалось выразить через вариацию и число степеней свободы. Проделаем те же действия с межгрупповой дисперсией.
Межгрупповая дисперсия
2
меж
s отражает разброс групповых средних. Мы вычисляли ее по формуле
2 2
меж
X
s
ns
=
Здесь
2
X
s равно
(
) (
) (
)
(
)
2 2
2 2
1 2
3 2
1
m
X
X
X
X
X
X
X
X
X
s
m

+

+

+ +

=


В более общем виде:
(
)
2
г
2
г
,
1
X
X
X
s
m

=


где т — число групп. Под символом суммы стоит значок «г»,
это означает, что теперь мы суммируем по группам, а не по боль- ным. Подставив это выражение в формулу межгрупповой дисперсии, получим:
(
)
2
г
2
г меж
,
1
n
X
X
s
m

=


Величину в числителе назовем межгрупповой вариацией и обозначим S
меж
:
(
)
2
меж г
г
S
n
X
X
=


Тогда
2
меж меж
1
S
s
m
=

В этой формуле мы снова обнаруживаем число степеней сво- боды из гл. 3, на этот раз это межгрупповое число степеней сво- боды:
ν
меж
= т – 1. Тем самым
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ

300 2
меж меж меж
S
s
=
ν
В нашем примере (табл. 9.1)
ν
меж
= m – 1 = 4 – 1 = 3. Тогда
2
меж
0,685 3 0, 228.
s
=
=
Формула для критерия F в новых обозначениях принимает вид:
меж меж вну вну
S
F
S
ν
=
ν
Соответственно, в рассматриваемом примере
0,228 1,4.
0,159
F
=
=
Новая формула для F получена непосредственно из приве- денной в гл. 3 и отличается от нее только обозначениями. Поэто- му, конечно, значение F = 1,4 совпадает с найденным в гл. 3.
Естественно спросить, зачем же потребовались столь про- странные рассуждения и многочисленные тождественные заме- ны? Неужели для одного только повторения ранее полученных результатов? Ответ состоит в том, что переход к использованию вариации дает возможность понять, из каких компонентов она складывается, и в дальнейшем перейти к дисперсионному ана- лизу повторных измерений.
Разложение общей вариации
Внутригрупповая вариация S
вну служит мерой разброса значе- ний внутри трупп. В свою очередь, межгрупповая вариация
S
меж
— это мера разброса групповых средних, то есть различий между группами. Но существует и мера общего разброса зна- чений. Это общая сумма квадратов отклонений всех наблюдае- мых значений от их общего среднего. Она называется общей
вариацией и обозначается S
общ
:
(
)
2
общ гб г
б
S
X
X
=

∑∑
ГЛАВА 9


301
Два символа суммы означают, что суммирование произво- дится по всем группам и всем больным внутри каждой группы.
Число степеней свободы общей вариации обозначается
ν
общ и равно тп – 1, то есть оно на единицу меньше общего числа больных (т — число групп, п — число больных в каждой груп- пе).
В рассматриваемом примере S
общ
= 4,51 и
ν
общ
= 4
× 7 – 1 = 27
Обратите внимание, что общая дисперсия, вычисленная по всем наблюдениям, равна
(
)
2
гб общ общ
2
г б
общ общ
1 1
X
X
S
S
s
mn
mn

=
=
=


ν
∑∑
Существует ли связь между рассмотренными видами вариа- ции: общей, внугригрупповой и межгрупповой? Оказывается,
существует, и очень простая. Общая вариация равна сумме внут-
ригрупповой и межгрупповой вариаций:
общ вну меж
S
S
S
=
+
Докажем справедливость этого разложения (это доказатель- ство можно пропустить). Тождественно верно
(
) (
) (
)
гб гб г
г
X
X
X
X
X
X

=

+

Возведем левую и правую части тождества в квадрат:
(
) (
) (
)
2 2
гб гб г
г
X
X
X
X
X
X



=

+



Просуммируем левую часть по всем наблюдениям:
(
)
2
гб г
б
X
X

∑∑
Это не что иное, как общая вариация S
общ
Правая часть преобразуется в
(
) (
)(
) (
)
2 2
гб г
гб г
г г
2
X
X
X
X
X
X
X
X

+


+

Суммируя по всем наблюдениям, получим
(
)
(
)(
)
(
)
2 2
гб г
гб г
г г
г б
г б
г б
2
X
X
X
X
X
X
X
X

+


+

∑∑
∑∑
∑∑
АНАЛИЗ ПОВТОРНЫХ ИЗМЕРЕНИЙ

302
Первый член этого выражения,
(
)
2
гб г
г б
X
X

∑∑
, представ- ляет собой значение S
вну
Покажем, что второй член,
(
)(
)
гб г
г г
б
2
X
X
X
X


∑∑
,тожде- ственно равен нулю.
В самом деле, разность
(
)
г
X
X

в каждой из групп посто- янна, и поэтому ее можно вынести за знак суммирования по больным:
(
)(
)
(
) (
)
гб г
г г
гб г
г б
г б
2 2
X
X
X
X
X
X
X
X


=


∑∑


Ноэто среднее по группе, то есть гб б
г
X
X
n
=

В таком случае
(
)
(
)
гб г
гб г
гб г
б б
б б
гб б
г г
г
0.
X
X
X
X
X
nX
X
n
X
n X
X
n

=

=

=




=

=

=











Рассмотрим третий член. Поскольку г
X
X
− для всех боль- ных в группе одинаково,
(
)
(
)
2 2
г г
б г
,
X
X
n
X
X

=



а это величина S
меж
Итак, имеем:
общ вну меж вну меж
0
,
S
S
S
S
S
=
+ +
=
+
что и требовалось доказать.
Как общая вариация разлагается на две составляющие — вну- тригрупповую и межгрупповую, так и общее число степеней свободы разлагается на внутригрупповое и межгрупповое. Дей- ствительно, поскольку
ν
общ
= mn – 1,
ν
меж
= m – 1 и
ν
вну
= m(n – 1), то
ν
меж
+
ν
вну
= m – 1 + m(n – 1) = m(l + n – l) – l = mn – l =
ν
общ
ГЛАВА 9


303
1   ...   20   21   22   23   24   25   26   27   ...   37