ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.04.2021
Просмотров: 1646
Скачиваний: 36
6
ситуации распределений выборки), то в общем случае гипотеза
Но задаѐтся указанием соответствующего класса
F
0
F
,
которому, по предположению, принадлежит истинное
распределение выборки. Это записывается так: H
0
:F
x
F
0
.
Распределения из дополнительного класса
F
1
=
F
\
F
0
называют
альтернативными распределениями
или
альтернативами.
Утверждение же вида H
1
: F
x
F
1
называют
альтернативной
гипотезой.
В этих терминах в общем случае задача
формулируется как задача проверки H
0
против альтернативы
Н
1
. Гипотеза H
0
(или альтернатива H
1
) называется
простой
,
если соответствующий класс
F
0
(
F
1
) содержит одно
распределение.
Сложной
гипотезе соответствует более чем
одно распределение. Гипотезы о параметрах распределения
называются
параметрическими.
6.2. Статистические критерии проверки гипотез
Критерий - это правило, которое для каждой реализации
x
выборки
X
должно приводить к одному из двух решений:
решение
0
- принять гипотезу H
0
и решение
1
-отклонить H
0
(принять H
1
). Каждому критерию соответствует разбиение
выборочного пространства
X
на два взаимно дополнительных
множества
X
0
и
X
1
(
X
0
X
1
=
,
X
0
X
1
=
X
) , где
X
0
состоит из точек
x
, для которых гипотеза H
0
принимается, а
X
1
из точек, для которых H
0
отвергается. Множество
X
0
называют
областью принятия гипотезы
H
0
(или
допустимой
областью), а
X
1
областью еѐ отклонения или
критической
областью
. Таким образом, выбор правила проверки гипотезы
Н
0
эквивалентен заданию критической области
X
1
. Если
критическая область
X
1
выбрана, то критерий формулируется
так: пусть
x
- реализация выборки
X
, тогда при
x
X
1
гипотезу Н
0
отвергают [принимают Н
1
], если же
x
X
0
, то
гипотезу Н
0
принимают.
7
В
некоторых
ситуациях
рассматривают
рандомизованные
критерии, когда при наблюдении
x
гипотезу Н
0
отвергают с некоторой вероятностью
(
x
) и
принимают с дополнительной вероятностью 1-
(
x
)0.
Рандомизованный критерий характеризуется критической
функцией
(
x
) {0
(
x
)
1,
x
X
}. Если
(
x
) принимает
только
два
значения:
0
и
1,
то
приходим
к
нерандомизированному критерию
с критической областью
X
1
={
x
:
(
x
)=1}.
Будем
далее
рассматривать
нерандомизированные критерии, которые используют на
практике.
6.3. Общий принцип выбора критической области
критерия
В процессе проверки гипотезы Н
0
можно прийти к
правильному решению или совершить ошибку первого рода -
отклонить H
0
, и когда она верна, или ошибку второго рода -
принять Н
0
, когда она ложна. Иными словами ошибка первого
рода имеет место, если точка
x
попадает в критическую
область
X
1
в то время, как верна нулевая гипотеза Н
0
, а
ошибка второго рода, когда
x
X
0
, но гипотеза Н
0
не верна
(верна альтернатива Н
1
).
Вероятности этих ошибок можно выразить через
функцию
мощности
W(F) критерия
X
1
: W(F)=W(
X
1
;F)=P(
X
X
1
F), F
F
,
т.е. вероятность попадания в критическую область, когда F -
истинное распределение выборки. Вероятности ошибок можно
представить так:
1. Ошибка первого рода - принимается решение
1
:
гипотеза Н
0
не справедлива, когда она на самом деле
справедлива
P(
1
H
0
)=P(
X
X
1
H
0
)=W(F), F
F
0
. (6.1)
2.
Ошибка второго рода - принятие решения
0
, когда
справедлива альтернатива Н
1
8
P(
0
H
1
)=P(
X
X
0
H
1
)=1-P(
X
X
1
H
1
)=1-W(F), F
F
1.
(6.2)
Желательно провести проверку гипотезы так, чтобы
свести к минимуму вероятности обоих типов ошибок. На
практике в общем случае сделать это невозможно.
Рациональный принцип выбора критической области можно
сформулировать так: при заданном числе испытаний n
устанавливается граница для вероятности ошибки первого
рода и при этом выбирается критическая область
X
1
, для
которой вероятность ошибки второго рода минимальна.
Выбирается число
между 0 и 1 и налагается условие
W(F)
,
F
F
0
. (6.3)
При этом условии желательно сделать минимальной величину
1-W(F) для всех F
F
0
(за счет выбора критической области
X
1
). Или, что то же самое, сделать максимальной мощность
W(F),
F
F
0
.
(6.4)
Величину
в формуле (6.3) называют
уровнем значимости
,
критерий обозначают
X
1
.
Обычно выбирают одно из следующих стандартных
значений:
=0.05; 0.01; 0.1.
В терминах функции мощности W(F) можно сказать, что
критерий тем лучше, чем больше его мощность при
альтернативах. Действительно, если наблюдавшееся значение
x
выборки попадает в критическую область, то Н
0
(нулевую
гипотезу) отклоняют, и если истинной является альтернатива,
то тем самым принимают правильное решение. Обычно
критическая область задаѐтся с помощью некоторой
статистики Т(
X
) и имеет следующий вид:
X
1
={
x
: Т(
x
)
c}
или
X
1
={
x
: Т(
x
)
c}, или
X
1
={
x
:
Т(
x
)
c}.
Функцию наблюдений Т(
X
) называют в этом случае
статистикой критерия
, а критическую область задают
непосредственно в терминах еѐ значений. Если
T=
{t: t=Т(
x
),
x
X
} -множество всех возможных значений статистики Т, то
критическая область критерия есть некоторое подмножество
T
1
T
, которое должно включать все маловероятные, при
9
гипотезе Н
0
, значения Т. При заданном уровне значимости
для критической области используют обозначение
T
1
. Для
функции мощности в этом случае имеем условие
W(F)=P(Т(
X
)
T
1
F)
,
F
F
0
. (6.3’)
Выбор статистики критерия произволен до некоторой
степени, на практике для конкретных задач выбор статистики
ясен. Главным для расчѐта критерия, как следует из (6.3
’
),
является отыскание распределения статистики Т(
X
) в случае
справедливости гипотезы Н
0
. Чтобы полностью вычислить
функцию мощности критерия, и тем самым исследовать и
вероятность ошибки второго рода, требуется знать
распределение статистики Т(
X
) и при альтернативах, что
является весьма трудной задачей.
6.4. Понятие параметрической гипотезы
Важный класс статистических гипотез составляют
гипотезы об истинном значении неизвестного параметра,
определяющего
заданное
параметрическое
семейство
распределений. В этом случае класс
F
допустимых
распределений наблюдаемой случайной величины
имеет вид
F
=
{F(x,
),
)
.
Функции этого класса находят в
соответствии со значениями параметра
=(
1
,...,
r
) из
некоторого параметрического множества
. Гипотезы поэтому
по
существу
относятся
к
неизвестным
параметрам
распределения и называются
параметрическими
. Примерами
параметрических гипотез являются следующие утверждения:
1)
Н
0
:
=
0
, где
0
- некоторое фиксированное
значение параметра.
2)
Н
0
:
1
=
2
=...=
r
.
3)
Н
0
: g(
)=g
0
, где g(
) - некоторая (в общем случае
векторная) функция
, g
0
- фиксированное значение.
В общем случае параметрическая гипотеза задаѐтся
указанием некоторого подмножества
0
, элементом
10
которого
является,
по
предположению,
неизвестная
параметрическая точка
.
Обозначение: Н
0
:
0
.
Альтернативная гипотеза имеет вид Н
1
:
1
=
\
0
;
точки E
1
называют
альтернативными
.
Если множество
0
(
1
) состоит из одной точки, то
гипотезу Н
0
(альтернативу Н
1
) называют
простой
, в противном
случае гипотезу (или альтернативу) называют
сложной .
Например, гипотеза 1) - простая; 2) - сложная, а 3) - может
быть как простой, так и сложной.
Поверка параметрической статистической гипотезы при
помощи критерия значимости может быть разбита на
следующие этапы:
1)
сформировать проверяемую (Н
0
) и альтернативную
(Н
1
) гипотезы ;
2)
назначить уровень значимости
;
3)
выбрать статистику Т(
X
) критерия для проверки
гипотезы Н
0
;
4)
определить выборочное распределение статистики Т
при условии, что верна гипотеза Н
0
;
5)
в зависимости от формулировки альтернативной
гипотезы определить критическую область X
1
одним из
неравенств: Т>t
1-
; T<t
или совокупностью неравенств
Т> t
1
2
; T<
t
2
6)
получить
выборку
наблюдений
и
вычислить
выборочное значение статистики критерия T
b
.
7)
принять статистическое решение: если T
b
X
0
, то
принять Н
0
, т.е. считать, что гипотеза Н
0
не противоречит
результатам наблюдений; если T
b
X
1
, то отклонить гипотезу
Н
0
, как не согласующуюся с результатами наблюдений.
Замечание.
Обычно на этапах 4 - 7 используют статистику, квантили
которой
табулированы:
статистику
с
нормальным
распределением N(0,1); статистику Стьюдента, статистику
2