ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.12.2023
Просмотров: 573
Скачиваний: 7
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
88
КРИТИЧЕСКОЕ ЗНАЧЕНИЕ t
Напомним, что мы рассматриваем отношение
Разность выборочных средних
Стандартная ошибка разности выборочных средних
=
t
Воспользовавшись результатом предыдущего раздела, имеем
1 2
1 2
2 2
−
=
+
X
X
X
X
t
s
s
Если ошибку среднего выразить через выборочное стандар- тное отклонение, получим другую запись этой формулы
1 2
2 2
1 2
,
−
=
+
X
X
t
s
s
n
n
где n — объем выборки.
Если обе выборки извлечены из одной совокупности, то вы- борочные дисперсии
2 1
s
и
2 2
s
— это оценки одной и той же дис- персии
σ
2
. Поэтому их можно заменить на объединенную оцен-
ку дисперсии. Для выборок равного объема объединенная оцен- ка дисперсии вычисляется как
2 2
2 1
2 2
+
=
s
s
s
Значение t, полученное на основе объединенной оценки
1 2
2 2
−
=
+
X
X
t
s
s
n
n
Если объем выборок одинаков, оба способа вычисления t да- дут одинаковый результат. Однако если объем выборок разный,
то это не так. Вскоре мы увидим, почему важно вычислять объе- диненную оценку дисперсии, а пока посмотрим, какие значения
ГЛАВА 4
89
t мы будем получать, извлекая случайные пары выборок из одной и той же нормально распределенной совокупности.
Так как выборочные средние обычно близки к среднему по совокупности, значение t будет близко к нулю. Однако иногда мы все же будем получать большие по абсолютной величине значе- ния t (вспомним опыты с F в предыдущей главе). Чтобы понять,
какую величину t следует считать достаточно «большой», чтобы отвергнуть нулевую гипотезу, проведем мысленный эксперимент,
подобный тому, что мы делали в предыдущей главе. Вернемся к испытаниям предполагаемого диуретика. Допустим, что в дей- ствительности препарат не оказывает диуретического действия.
Тогда и контрольную группу, которая получает плацебо, и экспе- риментальную, которая получает препарат, можно считать слу- чайными выборками из одной совокупности. Пусть это будет со- вокупность из 200 человек, представленная на рис. 4.4А. Члены контрольной и экспериментальной групп различаются штрихов- кой. В нижней части рисунка данные по этим двум выборкам показаны так, как их видит исследователь. Взглянув на эти дан- ные, трудно подумать, что препарат — диуретик. Полученное по этим выборкам значение t равно –0,2.
Разумеется, с не меньшим успехом можно было бы извлечь любую другую пару выборок, что и сделано на рис. 4.4Б. Как и следовало ожидать, две новые выборки отличаются как друг от друга, так и от извлеченных ранее (рис. 4.4А). Интересно, что на этот раз нам «повезло» — средний диурез довольно сильно раз- личается. Соответствующее значение t равно –2,1. На рис. 4.4В
изображена еще одна пара выборок. Они отличаются друг от друга и от выборок с рис. 4.4А и 4.4Б. Значение t для них равно 0.
Разных пар выборок можно извлечь более 10 27
. На рис. 4.5А
приведено распределение значений t, вычисленных по 200 парам выборок. По нему уже можно судить о распределении t. Оно сим- метрично относительно нуля, поскольку любую из пары выбо- рок можно счесть «первой». Как мы и предполагали, чаще всего значения t близки к нулю, значения, меньшие –2 и большие +2,
встречаются редко.
На рис. 4.5Б видно, что в 10 случаях из 200 (в 5% всех случаев)
t меньше –2,1 или больше +2,1. Иначе говоря, если обе выборки извлечены из одной совокупности, вероятность того, что значение
СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА
90
Рис. 4.4.
ГЛАВА 4
91
t лежит вне интервала от –2,1 до +2,1, составляет 5%. Продолжая извлекать пары выборок, мы увидим, что распределение прини- мает форму гладкой кривой, показанной на рис. 4.5В. Теперь 5%
крайних значений соответствуют закрашенным областям графи- ка левее –2,1 и правее +2,1. Итак, мы нашли, что если две выбор- ки извлечены из одной и той же совокупности, то вероятность получить значение t, большее +2,1 или меньшее –2,1, составля- ет всего 5%. Следовательно, если значение t находится вне
Рис. 4.4. Испытания предполагаемого диуретика. А. В действительности препа- рат не обладает диуретическим действием, поэтому обе группы — просто две слу- чайные выборки из совокупности, показанной в верхней части рисунка. Члены совокупности, которым посчастливилось принять участие в исследовании, поме- чены штриховкой. В нижней части рисунка данные показаны такими, какими их видит исследователь. Вряд ли он решит, что препарат — диуретик: средний диу- рез в группах различается очень незначительно. Б. Исследователю могла бы попа- сться и такая пара выборок. В этом случае он наверняка бы счел препарат диуре- тиком. В. Еще две выборки из той же совокупности.
СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА
92
Рис. 4.5. А. Из совокупности, показанной на рис. 4.4, извлекли 200 пар случайных выборок по 10 членов в каждой, для каждой пары рассчитали значение t и нанесли его на график. Значения для t трех пар выборок с рис. 4.4 помечены черным. Боль- шая часть значений сгруппирована вокруг нуля, однако некоторые значения по абсолютной величине превышают 1,5 и даже 2. Б. Число значений, по абсолютной величине превышающих 2,1 составляет 5%. В. Продолжая извлекать пары выбо- рок, в конце концов мы получим гладкую кривую. 5% наибольших (по абсолют- ной величине) значений образуют две заштрихованные области (сумма заштрихо- ванных площадей как раз и составляет 5% всей площади под кривой). Следова- тельно «большие» значения t начинаются там, где начинается заштрихованная область, то есть с t =
±2,1. Вероятность получить столь высокое значение t, извле- кая случайные выборки из одной совокупности, не превышает 5%. Г. Описанный способ выбора критического значения t предопределяет возможность ошибки: в
5% случаев мы будем находить различия там, где их нет. Чтобь снизить вероят- ность ошибочного заключения, мы можем выбрать более высокое критическое значение. Например, чтобы площадь заштрихованной области составляла 1% от обшей площади под кривой, критическое значение должно составлять 2,878.
B
Г
t
-3,0 -2,0 -1,0 0 1,0 2,0 3,0
93
интервала от –2,1 до +2,1, нулевую гипотезу следует отклонить,
а наблюдаемые различия признать статистически значимыми.
Обратите внимание, что таким образом мы выявляем отли- чия экспериментальной группы от контрольной как в меньшую,
так и в большую сторону — именно поэтому мы отвергаем ну- левую гипотезу как при t < –2,1 так и при t > +2,1. Этот вариант критерия Стьюдента называется двусторонним, именно его обы- чно и используют. Существует и односторонний вариант крите- рия Стьюдента. Используется он гораздо реже, и в дальнейшем говоря о критерии Стьюдента, мы будем иметь в виду двусто- ронний вариант.
Вернемся к рис. 4.4Б. На нем показаны две случайные вы- борки из одной и той же совокупности при этом t = – 2,2. Как мы только что выяснили, нам следует отвергнуть нулевую ги- потезу и признать исследуемый препарат диуретиком, что са- мой собой неверно. Хотя все расчеты были выполнены правиль- но, вывод ошибочен. Увы, такие случаи возможны.
Разберемся подробнее. Если значение t меньше –2,1 или боль- ше +2,1, то при уровне значимости 0,05 мы сочтем различия статистически значимыми. Это означает, что если бы наши груп- пы представляли собой две случайные выборки из одной и той же совокупности, то вероятность получить наблюдаемые раз- личия (или более сильные) равна 0,05. Следовательно, ошибоч- ный вывод о существовании различии мы будем делать в 5%
случаев. Один из таких случаев и показан на рис. 4.4Б.
Чтобы застраховаться от подобных ошибок, можно принять уровень значимости не 0,05, а скажем 0,01. Тогда, как видно из рис. 4.5Г, мы должны отвергать нулевую гипотезу при t < –2,88
или t > +2,88. Теперь-то рис. 4.4Б нас не проведет — мы не при- знаем подобные различия статистически значимыми. Однако во первых ошибочные выводы о существовании различий все же не исключены просто их вероятность снизилась до 1% и во вто- рых вероятность не найти различии там где они есть теперь повысилась. О последней проблеме подробнее мы поговорим в гл. 6.
Критические значения t (подобно критическим значениям F
они сведены в таблицу) зависят не только от уровня значимос- ти, но и от числа степеней свободы
ν. Если объем обеих выбо-
СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА
94
ГЛАВА 4
ν
0,5 0,2 0,1 0,05 0,02 0,01 0,005 0,002 0,001 1
1,000 3,078 6,314 12,706 31,821 63,656 127,321 318,289 636,578 2
0,816 1,886 2,920 4,303 6,965 9,925 14,089 22,328 31,600 3
0,765 1,638 2,353 3,182 4,541 5,841 7,453 10,214 12,924 4
0,741 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610 5
0,727 1,476 2,015 2,571 3,365 4,032 4,773 5,894 6,869 6
0,718 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959 7
0,711 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408 8
0,706 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041 9
0,703 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781 10 0,700 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587 11 0,697 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437 12 0,695 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318 13 0,694 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221 14 0,692 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140 15 0,691 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073 16 0,690 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015 17 0,689 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965 18 0,688 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922 19 0,688 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883 20 0,687 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850 21 0,686 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819 22 0,686 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792 23 0,685 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,768 24 0,685 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745 25 0,684 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725 26 0,684 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707 27 0,684 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,689 28 0,683 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674 29 0,683 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,660 30 0,683 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646 31 0,682 1,309 1,696 2,040 2,453 2,744 3,022 3,375 3,633 32 0,682 1,309 1,694 2,037 2,449 2,738 3,015 3,365 3,622 33 0,682 1,308 1,692 2,035 2,445 2,733 3,008 3,356 3,611 34 0,682 1,307 1,691 2,032 2,441 2,728 3,002 3,348 3,601 35 0,682 1,306 1,690 2,030 2,438 2,724 2,996 3,340 3,591 36 0,681 1,306 1,688 2,028 2,434 2,719 2,990 3,333 3,582 37 0,681 1,305 1,687 2,026 2,431 2,715 2,985 3,326 3,574 38 0,681 1,304 1,686 2,024 2,429 2,712 2,980 3,319 3,566 39 0,681 1,304 1,685 2,023 2,426 2,708 2,976 3,313 3,558 40 0,681 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
Уровень значимости
α
Таблица 4.1. Критические значения t (двусторонний вариант)
95
рок — n, то число степеней свободы для критерия Стьюдента равно 2(n – 1). Чем больше объем выборок, тем меньше крити- ческое значение t. Это и понятно — чем больше выборка, тем менее выборочные оценки зависят от случайных отклонении и тем точнее представляют исходную совокупность.
СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА
ν
0,5 0,2 0,1 0,05 0,02 0,01 0,005 0,002 0,001 42 0,680 1,302 1,682 2,018 2,418 2,698 2,963 3,296 3,538 44 0,680 1,301 1,680 2,015 2,414 2,692 2,956 3,286 3,526 46 0,680 1,300 1,679 2,013 2,410 2,687 2,949 3,277 3,515 48 0,680 1,299 1,677 2,011 2,407 2,682 2,943 3,269 3,505 50 0,679 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496 52 0,679 1,298 1,675 2,007 2,400 2,674 2,932 3,255 3,488 54 0,679 1,297 1,674 2,005 2,397 2,670 2,927 3,248 3,480 56 0,679 1,297 1,673 2,003 2,395 2,667 2,923 3,242 3,473 58 0,679 1,296 1,672 2,002 2,392 2,663 2,918 3,237 3,466 60 0,679 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,460 62 0,678 1,295 1,670 1,999 2,388 2,657 2,911 3,227 3,454 64 0,678 1,295 1,669 1,998 2,386 2,655 2,908 3,223 3,449 66 0,678 1,295 1,668 1,997 2,384 2,652 2,904 3,218 3,444 68 0,678 1,294 1,668 1,995 2,382 2,650 2,902 3,214 3,439 70 0,678 1,294 1,667 1,994 2,381 2,648 2,899 3,211 3,435 72 0,678 1,293 1,666 1,993 2,379 2,646 2,896 3,207 3,431 74 0,678 1,293 1,666 1,993 2,378 2,644 2,894 3,204 3,427 76 0,678 1,293 1,665 1,992 2,376 2,642 2,891 3,201 3,423 78 0,678 1,292 1,665 1,991 2,375 2,640 2,889 3,198 3,420 80 0,678 1,292 1,664 1,990 2,374 2,639 2,887 3,195 3,416 90 0,677 1,291 1,662 1,987 2,368 2,632 2,878 3,183 3,402 100 0,677 1,290 1,660 1,984 2,364 2,626 2,871 3,174 3,390 120 0,677 1,289 1,658 1,980 2,358 2,617 2,860 3,160 3,373 140 0,676 1,288 1,656 1,977 2,353 2,611 2,852 3,149 3,361 160 0,676 1,287 1,654 1,975 2,350 2,607 2,847 3,142 3,352 180 0,676 1,286 1,653 1,973 2,347 2,603 2,842 3,136 3,345 200 0,676 1,286 1,653 1,972 2,345 2,601 2,838 3,131 3,340
∞
0,675 1,282 1,645 1,960 2,327 2,576 2,808 3,091 3,291
Уровень значимости
α
Таблица 4.1. Окончание
J. H. Zar. Biostatistical analysis (2 ed.). Prentice-Hall, Englewood Cliffs, N. J., 1984.
96
ВЫБОРКИ ПРОИЗВОЛЬНОГО ОБЪЕМА
Критерий Стьюдента легко обобщается на случай, когда выбор- ки содержат неодинаковое число членов. Напомним, что по оп- ределению
1 2
1 2
2 2
,
−
=
+
X
X
X
X
t
s
s
где
1
X
s и
2
X
s — стандартные ошибки средних для двух выбо- рок.
Если объем первой выборки равен n
1
, а объем второй — n
2
, то
1 2
2 1
1
=
X
s
s
n и
2 2
2 2
2
,
=
X
s
s
n
где
1
s
и
2
s
— стандартные отклонения выборок.
Перепишем определение t, используя выборочные стандарт- ные отклонения:
1 2
2 2
1 2
1 2
−
=
+
X
X
t
s
s
n
n
Объединенная оценка дисперсии для выборок объема n
1
и n
2
равна
(
)
(
)
2 2
1 1
2 2
2 1
2 1
1 2
−
+
−
=
+ −
n
s
n
s
s
n
n
Тогда
1 2
2 2
1 2
−
=
+
X
X
t
s
s
n
n
Это определение t для выборок произвольного объема. Чис- ло степеней свободы
ν = n
1
+ n
2
– 2.
Заметим, что если объемы выборок равны, то есть n
1
= n
2
= n,
то мы получим ранее использовавшуюся формулу для t.
ГЛАВА 4
97
ПРОДОЛЖЕНИЕ ПРИМЕРОВ
Применим теперь критерий Стьюдента к тем данным, которые рассматривались при изучении дисперсионного анализа. Выво- ды, которые мы получим, не будут отличаться от прежних, по- скольку как говорилось критерий Стьюдента есть частный слу- чай дисперсионного анализа.
1 ... 4 5 6 7 8 9 10 11 ... 37