ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.04.2021

Просмотров: 1646

Скачиваний: 36

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

ситуации распределений выборки), то в общем случае гипотеза 
Но  задаѐтся  указанием  соответствующего  класса 

F

0

F

  , 

которому,  по  предположению,  принадлежит  истинное 
распределение  выборки.  Это  записывается  так:  H

0

:F

x

F

0

Распределения  из  дополнительного  класса 

F

1

=

F

\

F

0

  называют 

альтернативными  распределениями

  или 

альтернативами. 

Утверждение  же  вида  H

1

:  F

x

F

1

  называют 

альтернативной 

гипотезой. 

В  этих  терминах  в  общем  случае  задача 

формулируется  как  задача  проверки  H

0

  против  альтернативы 

Н

1

.  Гипотеза  H

0

  (или  альтернатива  H

1

)  называется 

простой

если  соответствующий  класс 

F

(

F

1

)  содержит  одно 

распределение. 

Сложной 

гипотезе  соответствует  более  чем 

одно  распределение.  Гипотезы  о  параметрах  распределения 
называются 

параметрическими. 

 

 

6.2. Статистические критерии проверки гипотез 

 

Критерий - это правило, которое для каждой реализации 

x

  выборки 

X

  должно  приводить  к  одному  из  двух  решений: 

решение 

0

 -  принять гипотезу  H

0

  и решение 

1

 -отклонить  H

0

 

(принять  H

1

).  Каждому  критерию  соответствует  разбиение 

выборочного пространства 

X

 на два взаимно дополнительных 

множества 

X

0

  и 

X

1

  (

X

0

X

1

=

X

0

X

1

=

X

)  ,  где 

X

0

 

состоит  из  точек 

x

,  для  которых  гипотеза  H

0

  принимается,  а 

X

1

  из  точек,  для  которых  H

0

  отвергается.  Множество 

X

0

 

называют 

областью принятия гипотезы 

H

0

 (или 

допустимой

 

областью),  а 

X

1

  областью  еѐ  отклонения  или 

критической 

областью

.  Таким  образом,  выбор  правила  проверки  гипотезы 

Н

0

  эквивалентен  заданию  критической  области 

X

1

.  Если 

критическая область 

X

1

 выбрана, то критерий формулируется 

так:  пусть 

x

  -  реализация  выборки 

X

,  тогда  при 

x

X

1

 

гипотезу  Н

0

  отвергают  [принимают  Н

1

],  если  же 

x

X

0

,  то 

гипотезу Н

0

 принимают.  


background image

 

В 

некоторых 

ситуациях 

рассматривают 

рандомизованные 

критерии,  когда  при  наблюдении 

x

 

гипотезу  Н

0

  отвергают  с  некоторой  вероятностью 

(

x

)  и 

принимают  с  дополнительной  вероятностью  1-

(

x

)0. 

Рандомизованный  критерий  характеризуется  критической 
функцией 

(

x

)  {0



(

x

)

1, 

x

X

}.  Если 

(

x

)  принимает 

только 

два 

значения: 

и 

1, 

то 

приходим 

к 

нерандомизированному  критерию 

с  критической  областью 

X

1

={

x

(

x

)=1}. 

Будем 

далее 

рассматривать 

нерандомизированные  критерии,  которые  используют  на 
практике. 

 

6.3. Общий принцип выбора критической области 

критерия

 

 

В  процессе  проверки  гипотезы  Н

0

  можно  прийти  к 

правильному решению или совершить  ошибку первого рода  - 
отклонить  H

0

,  и  когда  она  верна,  или  ошибку  второго  рода  - 

принять Н

0

, когда она ложна. Иными словами ошибка первого 

рода  имеет  место,  если  точка 

x

  попадает  в  критическую 

область 

X

1

  в  то  время,  как  верна  нулевая  гипотеза  Н

0

,  а 

ошибка  второго  рода,  когда 

x

X

0

,  но  гипотеза  Н

0

  не  верна 

(верна альтернатива Н

1

). 

Вероятности  этих  ошибок  можно  выразить  через 

функцию 

мощности

  W(F)  критерия 

X

1

:  W(F)=W(

X

1

;F)=P(

X

X

1

F),  F

F

т.е.  вероятность  попадания  в  критическую  область,  когда  F  - 
истинное распределение выборки. Вероятности ошибок можно 
представить так: 

1.  Ошибка  первого  рода  -  принимается  решение 

1

гипотеза  Н

0

  не  справедлива,  когда  она  на  самом  деле 

справедлива   

P(

1

H

0

)=P(

X

X

1

H

0

)=W(F), F

F

0

 .                                (6.1) 

2. 

 

Ошибка  второго  рода  -  принятие  решения 

0

,  когда 

справедлива альтернатива Н

1

  


background image

 

P(

0

H

1

)=P(

X

X

0

H

1

)=1-P(

X

X

1

H

1

)=1-W(F), F

F

1.

  (6.2) 

Желательно  провести  проверку  гипотезы  так,  чтобы 

свести  к  минимуму  вероятности  обоих  типов  ошибок.  На 
практике  в  общем  случае  сделать  это  невозможно. 
Рациональный  принцип  выбора  критической  области  можно 
сформулировать  так:  при  заданном  числе  испытаний  n 
устанавливается  граница  для  вероятности  ошибки  первого 
рода  и  при  этом  выбирается  критическая  область 

X

1

,  для 

которой  вероятность  ошибки  второго  рода  минимальна. 
Выбирается число 

 между 0 и 1 и налагается условие  

W(F)



F

F

0

 .                                           (6.3) 

При этом условии желательно сделать минимальной величину 
1-W(F)  для  всех  F

F

0

  (за  счет  выбора  критической  области 

X

1

). Или, что то же самое, сделать максимальной мощность 

W(F), 

F

F

0

 .

                                                    (6.4) 

Величину 

  в  формуле  (6.3)  называют 

уровнем  значимости

критерий обозначают 

X

1

Обычно  выбирают  одно  из  следующих  стандартных 

значений: 

=0.05; 0.01; 0.1. 

В терминах функции мощности W(F) можно сказать, что 

критерий  тем  лучше,  чем  больше  его  мощность  при 
альтернативах.  Действительно,  если  наблюдавшееся  значение 

x

  выборки  попадает  в  критическую  область,  то  Н

0

  (нулевую 

гипотезу) отклоняют, и если истинной является альтернатива, 
то  тем  самым  принимают  правильное  решение.  Обычно 
критическая  область  задаѐтся  с  помощью  некоторой 
статистики  Т(

X

)  и  имеет  следующий  вид: 

X

1

={

x

:  Т(

x

)

c} 

или 

X

1

={

x

: Т(

x

)

c}, или 

X

1

={

x

 Т(

x

)

c}.  

Функцию  наблюдений  Т(

X

)  называют  в  этом  случае 

статистикой  критерия

,  а  критическую  область  задают 

непосредственно  в  терминах  еѐ  значений.  Если 

T=

{t:  t=Т(

x

), 

x

X

} -множество всех возможных значений статистики Т, то 

критическая  область  критерия  есть  некоторое  подмножество 

T

1

T

,  которое  должно  включать  все  маловероятные,  при 


background image

 

гипотезе  Н

0

,  значения  Т.  При  заданном  уровне  значимости 

 

для  критической  области  используют  обозначение 

T

1

.  Для 

функции мощности в этом случае имеем условие  

W(F)=P(Т(

X

)

T

1

F)



,  

F

F

0

 .                             (6.3’) 

Выбор  статистики  критерия  произволен  до  некоторой 

степени, на практике для конкретных задач  выбор статистики 
ясен.  Главным  для  расчѐта  критерия,  как  следует  из  (6.3

), 

является  отыскание  распределения  статистики  Т(

X

)  в  случае 

справедливости  гипотезы  Н

0

.  Чтобы  полностью  вычислить 

функцию  мощности  критерия,  и  тем  самым  исследовать  и 
вероятность  ошибки  второго  рода,  требуется  знать 
распределение  статистики  Т(

X

)  и  при  альтернативах,  что 

является весьма трудной задачей. 
 

6.4. Понятие параметрической гипотезы 

 

Важный  класс  статистических  гипотез  составляют 

гипотезы  об  истинном  значении  неизвестного  параметра, 
определяющего 

заданное 

параметрическое 

семейство 

распределений.  В  этом  случае  класс 

F

 

допустимых 

распределений наблюдаемой случайной величины 

 имеет вид 

F

=

{F(x,

), 



)

.

  Функции  этого  класса  находят  в 

соответствии  со  значениями  параметра 

=(

1

,...,

r

)  из 

некоторого параметрического множества 

. Гипотезы поэтому 

по 

существу 

относятся 

к 

неизвестным 

параметрам 

распределения и называются 

параметрическими

. Примерами 

параметрических гипотез являются следующие утверждения: 

1)

 

Н

0

=

0

,  где 

0



  -  некоторое  фиксированное 

значение параметра. 

2)

 

Н

0

1

=

2

=...=

r

.  

3)

 

Н

0

:  g(

)=g

0

,  где  g(

)  -  некоторая  (в  общем  случае 

векторная) функция 

, g

0

 - фиксированное значение.  

В  общем  случае  параметрическая  гипотеза  задаѐтся 

указанием  некоторого  подмножества 

0



,  элементом 


background image

 

10 

которого 

является, 

по 

предположению, 

неизвестная 

параметрическая точка 

.  

Обозначение: Н

0



0

.  

Альтернативная  гипотеза  имеет  вид  Н

1



1

=

\

0

точки E



1

 называют 

альтернативными

.  

Если  множество 

(

1

)  состоит  из  одной  точки,  то 

гипотезу Н

0

 (альтернативу Н

1

) называют 

простой

, в противном 

случае  гипотезу  (или  альтернативу)  называют 

сложной  .

 

Например,  гипотеза  1)  -  простая;  2)  -  сложная,  а  3)  -  может 
быть как простой, так и сложной.  

Поверка  параметрической  статистической  гипотезы  при 

помощи  критерия  значимости  может  быть  разбита  на 
следующие этапы: 

1)

 

сформировать  проверяемую  (Н

0

)  и  альтернативную 

1

) гипотезы ; 

2)

 

назначить уровень значимости 

3)

 

выбрать  статистику  Т(

X

)  критерия  для  проверки 

гипотезы Н

0

4)

 

определить  выборочное  распределение  статистики  Т 

при условии, что верна гипотеза Н

0

5)

 

в  зависимости  от  формулировки  альтернативной 

гипотезы  определить  критическую  область  X

1

  одним  из 

неравенств:  Т>t

1-

;  T<t

  или  совокупностью  неравенств 

Т> t

1

2



; T<

t

2

 

6)

 

получить 

выборку 

наблюдений 

и 

вычислить 

выборочное значение статистики критерия T

b

7)

 

принять  статистическое  решение:  если  T

b

X

0

,  то 

принять  Н

0

,  т.е.  считать,  что  гипотеза  Н

0

  не  противоречит 

результатам наблюдений;  если T

b

X

1

, то отклонить гипотезу 

Н

0

, как не согласующуюся с результатами наблюдений. 

Замечание.

  

Обычно на этапах 4 - 7 используют статистику, квантили 

которой 

табулированы: 

статистику 

с 

нормальным 

распределением  N(0,1);  статистику  Стьюдента,  статистику 

2