Файл: Математическая статистика для чайников Консультация.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.11.2023

Просмотров: 102

Скачиваний: 9

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

????




????
∑︀
????=1
(????
????
− ????)
2
????
2
????,1−????/2
< ????
2 2
<
????
∑︀
????=1
(????
????
− ????)
2
????
2
????,????/2




= 1 − ????
Получили доверительный интервал для ????
2 2
:




????
∑︀
????=1
(????
????
− ????)
2
????
2
????,1−????/2
;
????
∑︀
????=1
(????
????
− ????)
2
????
2
????,????/2




3. Пусть есть выборка ????
1
, . . . , ????
????
∼ ???? (????
1
, ????
2 2
)
с неизвестным параметром ????
1
и неизвестным параметром ????
2 2
, который мы хотим оценить с помощью доверительного интервала с уровнем надежности 1 − ????.
Воспользуемся снова теоремой Фишера.
????????
2
????
2 2
∼ ????
2
????−1
– распределение не зависит от ????
2 2
, функция непрерывна и монотонна, а значит можно взять как центральную статистику. Границами опять возьмем квантили:
????
(︂
????
2
????−1,????/2
<
????????
2
????
2 2
< ????
2
????−1,1−????/2
)︂
= 1 − ????
????
(︃ ????
2
????−1,????/2
????????
2
<
1
????
2 2
<
????
2
????−1,1−????/2
????????
2
)︃
= 1 − ????
????
(︃
????????
2
????
2
????−1,1−????/2
< ????
2 2
<
????????
2
????
2
????−1,????/2
)︃
= 1 − ????
Получили доверительный интервал для ????
2 2
:
(︃
????????
2
????
2
????−1,1−????/2
;
????????
2
????
2
????−1,????/2
)︃
4. Пусть есть выборка ????
1
, . . . , ????
????
∼ ???? (????
1
, ????
2 2
)
с неизвестным параметром ????
2 2
и неизвестным параметром ????
1
, который мы хотим оценить с помощью доверительного интервала с уровнем надежности 1 − ????.
И снова воспользуемся теоремой Фишера.
( ¯
???? − ????
1
)

???? − 1

????
2
∼ ????(????−1)
– распределение не зависит от ????
1
, функция непрерывна и монотонна, а значит можно взять как центральную статистику.
Границами опять возьмем квантили:
????
(︂
????
????−1,????/2
<
( ¯
???? − ????
1
)

???? − 1

????
2
< ????
????−1,1−????/2
)︂
= 1 − ????
????
(︃ √
????
2
· ????
????−1,????/2

???? − 1
− ¯
???? < −????
1
<

????
2
· ????
????−1,1−????/2

???? − 1
− ¯
????
)︃
= 1 − ????
????
(︃


????
2
· ????
????−1,1−????/2

???? − 1
− ¯
???? < −????
1
<

????
2
· ????
????−1,1−????/2

???? − 1
− ¯
????
)︃
= 1 − ????
????
(︃
¯
???? −

????
2
· ????
????−1,1−????/2

???? − 1
< ????
1
< ¯
???? +

????
2
· ????
????−1,1−????/2

???? − 1
)︃
= 1 − ????
Получили доверительный интервал для ????
1
:
(︃
¯
???? −

????
2
· ????
????−1,1−????/2

???? − 1
; ¯
???? +

????
2
· ????
????−1,1−????/2

???? − 1
)︃
Обычно все эти большие формулы для разных доверительных интервалов сложно запомнить,
поэтому может быть легче понять, как они выводятся, и запомнить только теорему Фишера и определение распределения хи-квадрат.
8


Статистические гипотезы
Статистическая гипотеза – это какое-то предположение о распределении случайной ве- личины, либо о параметрах распределения, либо о свойствах распределения. Мы выдвигаем некоторое предположение, которое не хотим отвергать без явных свидетельств его ошибочно- сти, это предположение называется нулевой гипотезой (обозначается ????
0
), и она как раз- таки будет проверяться. В противовес ей идет альтернативная гипотеза (обозначается
????
????
, ????
1
, ????
2
, . . .
) – это отклонение от основной гипотезы, которое нам важно выявить (если оно действительно есть).
Чтобы принять решение, какую гипотезу выбрать в результате проверки, нужно еще до на- чала проверки установить статистический критерий – правило, на основании которого принимается решение, отвергнуть основную гипотезу в пользу альтернативной или нет, в за- висимости от результатов наблюдений. Это правило устанавливается так: берется функция от выборки ???? (????
1
, . . . , ????
????
)
, для которой известно распределение при верной основной гипотезе.
Такая функция называется статистикой критерия. После этого определяются границы критической области (или областей, если их несколько) – это область значений статистики,
при попадании в которую будет отвергаться основная гипотеза. Оставшаяся область называет- ся доверительной областью – при попадании в нее значения статистики основная гипотеза не будет отвергнута.
Также до начала проверки задается уровень значимости – допустимая вероятность от- вергнуть основную гипотезу, когда она верна. Обычно уровень значимости берут ???? = 0,05.
Итак, как же проверять гипотезу? Общий алгоритм действий выглядит следующим образом:
1. Формулируем основную и альтернативную гипотезы.
2. Выбираем уровень значимости.
3. Выбираем статистику.
4. Определяем, какое будет распределение у статистики, если верна основная гипотеза.
5. Строим доверительную и критическую области (определяем их границы).
6. Вычисляем реализацию статистики от нашей выборки.
7. Смотрим, куда попало значение статистики и принимаем решение, отвергнуть нулевую ги- потезу или нет.
Существует несколько известных критериев для проверки гипотез о разных распределениях.
Рассмотрим их все.
Биномиальный критерий
Есть выборка ????
1
, . . . , ????
????
∼ ????????(1, ????)
, где ???? неизвестно, и мы хотим выдвинуть гипотезу о его значении. Пойдем по пунктам алгоритма:
1. ????
0
: ???? = ????
0
(????
0
– это какое-то конкретное значение, например 0,5)
????
1
: ???? > ????
0 2. Выбираем какое-то значение ???? (допустим, 0,05)
3. ???? (????
1
, . . . , ????
????
) =
????
∑︀
????=1
????
????
(это равно числу успехов)
4. ???? (????
1
, . . . , ????
????
)|
????
0
∼ ????????(????, ????
0
)
5. Доверительная область будет в границах (−∞; ????
1−????
]
, а критическая область, соответственно,
в границах (????
1−????
; +∞)
(????
1−????
– это квантиль распределения ????????(????, ????
0
)
)
Остальные два пункта выполняются уже на конкретных выборках. По формуле из 3 пункта считается значение статистики, потом надо посмотреть, в какой промежуток попало число. Если в доверительный интервал, то говорят, что нулевая гипотеза не отвергается. Если в критический
9

интервал, то говорят, что нулевая гипотеза отвергается в пользу альтернативной.
Гипотезы в гауссовских моделях
1. Выдвигаем гипотезу о значении математического ожидании при известной дисперсии. Вы- борка ????
1
, . . . , ????
????
∼ ???? (????, ????
2
)
1. ????
0
: ???? = ????
0
(????
0
– это какое-то конкретное значение, например 1)
????
1
: ???? < ????
0
????
2
: ???? > ????
0
????
3
: ???? ̸= ????
0
Здесь это записано так для удобства, чтобы показать сразу, как проверяются несколько аль- тернативных гипотез. В реальных проверках гипотез всегда выдвигает одна альтернативная гипотеза, и уже относительно нее провеодятся дальнейшие вычисления. Здесь проверка гипо- тез будет отличаться только границами доверительной и критической областей.
2. некоторое ????
3. ???? (????
1
, . . . , ????
????
) =
( ¯
???? − ????
0
)

????
????
4. ???? (????
1
, . . . , ????
????
)|
????
0
∼ ???? (0, 1)
5. Для ????
1
доверительная область в границах [????
????
; +∞)
, критическая область в границах (−∞; ????
????
)
Для ????
2
доверительная область в границах (−∞; ????
1−????
]
, критическая область в границах (????
1−????
; +∞)
Для ????
3
доверительная область в границах [????
????/2
; ????
1−????/2
]
, критическая область в границах
(−∞; ????
????/2
) ∪ (????
1−????/2
; +∞)
2. Выдвигаем гипотезу о значении математического ожидании при неизвестной дисперсии. Вы- борка ????
1
, . . . , ????
????
∼ ???? (????, ????
2
)
1. ????
0
: ???? = ????
0
????
1
: ???? < ????
0
????
2
: ???? > ????
0
????
3
: ???? ̸= ????
0 2. некоторое ????
3. ???? (????
1
, . . . , ????
????
) =
( ¯
???? − ????
0
)

????
˜
????
( ˜
????
– корень из несмещенной выборочной лисперсии)
4. ???? (????
1
, . . . , ????
????
)|
????
0
∼ ????(???? − 1)
5. Для ????
1
доверительная область в границах [????
????,????−1
; +∞)
, критическая область в границах
(−∞; ????
????,????−1
)
Для ????
2
доверительная область в границах (−∞; ????
1−????,????−1
]
, критическая область в границах
(????
1−????,????−1
; +∞)
Для ????
3
доверительная область в границах [????
????/2,????−1
; ????
1−????/2,????−1
]
, критическая область в границах
(−∞; ????
????/2,????−1
) ∪ (????
1−????/2,????−1
; +∞)
3. Выдвигаем гипотезу о значении дисперсии при известном математическом ожидании. Вы- борка ????
1
, . . . , ????
????
∼ ???? (????, ????
2
)
1. ????
0
: ????
2
= ????
2 0
????
1
: ????
2
̸= ????
2 0
2. некоторое ????
3. ???? (????
1
, . . . , ????
????
) =
????
∑︀
????=1
(????
????
− ????)
2
????
2 0
4. ???? (????
1
, . . . , ????
????
)|
????
0
∼ ????
2
(????)
5. Доверительная область в границах [????
2
????/2,????
; ????
2 1−????/2,????
]
, критическая область в границах
(−∞; ????
2
????/2,????
) ∪ (????
2 1−????/2,????
; +∞)
4. Выдвигаем гипотезу о значении дисперсии при неизвестном математическом ожидании. Вы- борка ????
1
, . . . , ????
????
∼ ???? (????, ????
2
)
10


1. ????
0
: ????
2
= ????
2 0
????
1
: ????
2
̸= ????
2 0
2. некоторое ????
3. ???? (????
1
, . . . , ????
????
) =
????
∑︀
????=1
(????
????
− ¯
????)
2
????
2 0
4. ???? (????
1
, . . . , ????
????
)|
????
0
∼ ????
2
(???? − 1)
5. Доверительная область в границах [????
2
????/2,????−1
; ????
2 1−????/2,????−1
]
, критическая область в границах
(−∞; ????
2
????/2,????−1
) ∪ (????
2 1−????/2,????−1
; +∞)
Критерий Стьюдента
Пусть есть две выборки:
????
1
, . . . , ????
????
1
∼ ???? (????
1
, ????
2 1
)
????
1
, . . . , ????
????
2
∼ ???? (????
2
, ????
2 2
)
В них неизвестны все параметры, но ????
1
= ????
2
и все случайные величины независимы.
1. ????
0
: ????
1
− ????
2
= 0
????
1
: ????
1
− ????
2
< 0
????
2
: ????
1
− ????
2
> 0
????
3
: ????
1
− ????
2
̸= 0 2. некоторое ????
3. ???? (????
1
, . . . , ????
????
1
, ????
1
, . . . , ????
????
2
) =
¯
???? − ¯
????
ˆ
????
1
√︁
1
????
1
+
1
????
2
ˆ
????
2 1
=
????
1
∑︀
????=1
(????
????
− ¯
????)
2
+
????
2
∑︀
????=1
(????
????
− ¯
???? )
2
????
1
+ ????
2
− 2 4. ???? (????
1
, . . . , ????
????
)|
????
0
∼ ????(????
1
+ ????
2
− 2)
5. Для ????
1
доверительная область в границах [????
????,????
1
+????
2
−2
; +∞)
, критическая область в границах
(−∞; ????
????,????
1
+????
2
−2
)
Для ????
2
доверительная область в границах (−∞; ????
1−????,????
1
+????
2
−2
]
, критическая область в границах
(????
1−????,????
1
+????
2
−2
; +∞)
Для ????
3
доверительная область в границах [????
????/2,????
1
+????
2
−2
; ????
1−????/2,????
1
+????
2
−2
]
, критическая область в границах
(−∞; ????
????/2,????
1
+????
2
−2
) ∪ (????
1−????/2,????
1
+????
2
−2
; +∞)
Критерий Фишера
Пусть есть две выборки:
????
1
, . . . , ????
????
1
∼ ???? (????
1
, ????
2 1
)
????
1
, . . . , ????
????
2
∼ ???? (????
2
, ????
2 2
)
В них неизвестны все параметры, но все случайные величины независимы.
1. ????
0
: ????
2 1
= ????
2 2
????
1
: ????
2 1
̸= ????
2 2
2. некоторое ????
3. ???? (????
1
, . . . , ????
????
1
, ????
1
, . . . , ????
????
2
) =
˜
????
2
????
˜
????
2
????
4. ???? (????
1
, . . . , ????
????
1
, ????
1
, . . . , ????
????
2
)|
????
0
∼ ???? (????
1
− 1, ????
2
− 1)
5. Доверительная область в границах [????
????/2,????
1
−1,????
2
−1
; ????
1−????/2,????
1
−1,????
2
−1
]
, критическая область в гра- ницах [0; ????
????/2,????
1
−1,????
2
−1
) ∪ (????
1−????/2,????
1
−1,????
2
−1
; +∞)
11

Критерий проверки некоррелированности двух случайных величин
Пусть есть выборка из пар случайных величин (????
1
, ????
1
), . . . , (????
????
, ????
????
)
, порожденная гауссовским случайным вектором (????, ???? )
1. ????
0
: ????
????????
= 0
????
1
: ????
????????
< 0
????
2
: ????
????????
> 0
????
3
: ????
????????
̸= 0 2. некоторое ????
3. ???? ((????
1
, ????
1
), . . . , (????
????
, ????
????
)) =

???? − 2 ˆ
????
????????
√︀1 − ˆ
????
2
????????
ˆ
????
????????
=
1
????
????
∑︀
????=1
(????
????
− ¯
????)(????
????
− ¯
???? )
√︂ 1
????
????
∑︀
????=1
(????
????
− ¯
????)
2 1
????
????
∑︀
????=1
(????
????
− ¯
???? )
2 4. ???? ((????
1
, ????
1
), . . . , (????
????
, ????
????
))|
????
0
∼ ????(???? − 2)
5. Для ????
1
доверительная область в границах [????
????,????−2
; +∞)
, критическая область в границах
(−∞; ????
????,????−2
)
Для ????
2
доверительная область в границах (−∞; ????
1−????,????−2
]
, критическая область в границах
(????
1−????,????−2
; +∞)
Для ????
3
доверительная область в границах [????
????/2,????−2
; ????
1−????/2,????−2
]
, критическая область в границах
(−∞; ????
????/2,????−2
) ∪ (????
1−????/2,????−2
; +∞)
Существуют еще два критерия, но они посложнее, и на экзамене не попадутся. Приведу еще пример решения задачи на доверительный интервал и на проверку гипотезы из нулевика про- шлого года, чтобы было понятно, как это все используется, хотя в целом, по сути просто надо подобрать формулу под нужную ситуацию, подставить числа и аккуратно все посчитать.
Задание: Из произведённой партии шоколадных батончиков случайным образом были вы- браны шесть штук, вес которых (в граммах) составил 49.1; 50,3; 49.6; 51,2; 48.4; 49.8. Постройте центральный доверительный интервал уровня надёжности 0,95 для среднего веса батончика.
Проверьте гипотезу о том, что средний вес батончика составляет 50 г. Уровень значимости принять равным 0.1. Предполагается, что наблюдения имеют гауссовское распределение.
Решение:
Вначале проведем вспомогательные вычисления, то есть посчитаем выборочное математиче- ское ожидание и несмещенную выборочную дисперсию:
???? =
1 6
6
∑︀
????=1
????
????
=
1 6
(49,1 + 50,3 + 49,6 + 51,2 + 48,4 + 49,8) =
298,4 6
= 49,73
˜
????
2
=
1 5
6
∑︀
????=1
(????
????
− 49,73)
2
=
1 5
(0,3969 + 0,3249 + 0,0169 + 2,1609 + 1,7689 + 0,0049) =
4,6734 5
= 0,9347
˜
???? =

0,9347 = 0,9668
Так как неизвестно ни математическое ожидание рассматриваемого распределения, ни дис- персия, то доверительный интервал уровня надежности 0,95 будет иметь следующий вид:
???? (???? −
˜
????????
5;0,975

6
< ????
1
< ???? +
˜
????????
5;0,975

6
) = 0,95
???? (49,73 −
0,9668 · 2,5706 2,4495
< ????
1
< 49,73 +
0,9668 · 2,5706 2,4495
) = 0,95
???? (48,7154 < ????
1
< 50,7446) = 0,95
Доверительный интервал уровня надежности 0,95 равен (48,7154; 50,7446)
12


Проверим гипотезу о среднем весе батончика. Выборка распределена по гауссовскому зако- ну, но ни математическое ожидание, ни дисперсия неизвестны.
????
1
, . . . , ????
6
∼ ???? (????, ????
2
)
Пройдем по всем пунктам проверки гипотезы.
1. Основная гипотеза: ????
0
: ???? = 50
, альтернативная гипотеза: ????
1
: ???? ̸= 50 2. ???? = 0,1 3. ???? (????) =
(???? − 50)

6
˜
????
=
(49,73 − 50)

6 0,9668
= −
0,6614 0,9668
= −0,684 4. ???? (????)|
????
0
∼ ????(6)
5. Доверительная область лежит в границах от −????
5;0,95
до ????
5;0,95
, то есть от −2,015 до 2,015.
Полученное в пункте 3 значение попадает в эту область, значит, гипотеза верна на уровне зна- чимости 0,1.
Ответ: Доверительный интервал: (48,7154; 50,7446); гипотеза верна.
13