Файл: Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов всех специальностей.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.06.2024

Просмотров: 264

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

72

брать два значения 12 и 22 , чтобы площадь, заключённая под дифференциальной функцией распределения 2 между 12 и 22 , была равна 1α . Обычно 12 и 22 выбирают такими, чтобы

p{ 2 < 12}= p{ 2 > 22}=α 2 .

Так

 

как

таблица

содержит

p{ 2 > 2 то p{ 2 < 2}=1p{ 2 < 2

}=1

α

2

.

 

 

 

k

1

 

 

 

1

 

 

 

 

}p{ 2 > 2}.

Отсюда

 

)2

 

< 2

 

 

 

> 2

p 2

< nS

σ 2

= p{ 2

 

1

 

 

2

 

< nS)2

 

 

1

 

2

Преобразуем

двойное

неравенство

2

 

 

< 2

. Запишем

 

 

 

 

 

 

1

 

σ 2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

неравенство, обратное данному, тогда знаки неравенства изменят-

ся

 

на

 

противоположные

1 2 >σ 2

)2 >

1 2

или

 

 

<σ 2

 

 

 

1

nS

2

 

1

2

)2

<

1 2 . Умножая обе части неравенства на поло-

2

 

nS

 

1

 

 

 

 

жительное число nS)2, отличное от нуля, окончательно получаем доверительный интервал для дисперсии генеральной совокупно-

сти nS)2 22 <σ 2 < nS)2 12 .

Пример 45. Построить доверительный интервал с вероятностью p = 0,95 для дисперсии генеральной совокупности случай-

ной величины Х, распределённой нормально, если S)2 =10, n = 20 . Решение. Доверительная вероятность

p =1 α = 0,95; α = 0,025. По таблице (см.

приложение табл. 4)

находим для p

2

=α

2

= 0,025, k = n 1 =19

значение 2

= 32,9 ,

 

 

 

 

 

 

 

 

 

 

2

 

 

 

для

p =1 α

2

= 0,975, k =19

значение

 

 

2 = 8,91.

 

Тогда

 

1

 

 

 

 

 

20 10

1

 

20 10

 

 

доверительный

интервал

имеет

вид

<σ 2 <

 

или

32,9

 

8,91

 

6,079 <σ 2 < 22,447 .

 

 

 

 

 

 

 

 

 

Для

оценки среднего квадратического

отклонения доверительный интервал

 

<σ <

 

или

6,079

22,447

2,466 <σ < 4,738 .

 

 

 

 

 

 

 

 

 

 

 

 

 


73

49. Понятие статистической гипотезы Общая постановка задачи проверки гипотез

Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, проверяемое по выборке. Статистические гипотезы классифицируются на гипотезы о законах распределения и гипотезы о параметрах распределения.

О.1. Статистическая гипотеза называется непараметрической, если в ней сформулировано предположение относительно функции распределения.

О.2. Статистическая гипотеза называется параметрической, если в ней сформулировано предположение относительно значений параметров функции распределения известного вида.

Наиболее полное и безошибочное суждение относительно истинности такого вида гипотез можно было бы сделать при исследовании всей генеральной совокупности. Однако на практике сплошное исследование по ряду причин провести невозможно. Таким образом, суждения об истинности (ложности) статистических гипотез относительно вида функции распределения генеральной совокупности F (x;Θ) или о значениях параметров рас-

пределения известного вида принимаются на основании выборки объёма n. Процесс использования выборки для проверки истинности (ложности) статистических гипотез называется статисти-

ческим доказательством истинности (ложности) выдвинутой гипотезы. Наряду с выдвинутой гипотезой рассматривают одну или несколько альтернативных (конкурирующих) гипотез. Если выдвинутая гипотеза будет отвергнута, то её место занимает конкурирующая гипотеза. С этой точки зрения статистические гипотезы подразделяются на нулевые и альтернативные.

О.3. Нулевой гипотезой называют основную (выдвинутую) гипотезу. Нулевую гипотезу обозначают символом H0. Обычно

нулевые гипотезы утверждают, что различие между сравниваемыми величинами (параметрами или функциями распределения) отсутствует, а наблюдаемое отклонение объясняется лишь случайными колебаниями выборки.

О.4. Альтернативной называется гипотеза, конкурирующая с нулевой гипотезой в том смысле, что если нулевая гипотеза отвергается, то принимается альтернативная. Альтернативную гипотезу обозначают символом H1.


74

О.5. Параметрическая гипотеза называется простой, если она содержит только одно предположение относительно параметра.

О.6. Параметрическая гипотеза называется сложной, если она состоит из конечного или бесконечного числа простых гипотез.

Проверка статистических гипотез осуществляется на основе данных выборки. Для этого используют специальным образом подобранную случайную величину (выборочную статистику), являющуюся функцией наблюдённых значений, точное или приближённое распределение которой известно.

О.7.Статистическим критерием (тестом) называют случайную величину К, с помощью которой принимаются решения о принятии или отвержении выдвинутой нулевой гипотезы.

Для проверки нулевых гипотез по выборочным данным вычисляют частные значения входящих в критерий величин и, таким образом, получают частное (наблюдаемое) значение критерия.

О.8. Проверка гипотезы с помощью статистического критерия значимости есть правило отклонения нулевой гипотезы, заключающееся в разбиении области возможных значений К на две непересекающиеся подобласти, причём нулевая гипотеза отвергается, если наблюдаемое значение критерия К принадлежит критической подобласти, и считается согласующейся с опытом, если наблюдаемое значение критерия К не принадлежит критической подобласти.

50.Ошибки, допускаемые при проверке статистических гипотез Уровень значимости статистического критерия

О.1. Ошибкой первого рода называется ошибка отклонения верной нулевой гипотезы H0.

О.2. Уровнем значимости статистического критерия называется вероятность α совершения ошибки первого рода.

Отклонение нулевой H0 гипотезы при уровне значимости α = 0,05 означает, что, отклоняя эту гипотезу, мы или не ошибаемся (то есть гипотеза H0 действительно ложная), или всё-таки совершаем ошибку первого рода, считая правильную гипотезу H0

ложной. В последнем случае частота принятия ошибочного решения равна в среднем 5 из 100 случаев применения данного статистического критерия.

75

О.3. Ошибкой второго рода называется ошибка принятия ложной гипотезы H0.

Вероятность совершения ошибки второго рода принято обозначать β .

О.4. Мощностью М критерия К называется вероятность (1β) несовершения ошибки второго рода (мощность критерия К

-это вероятность отклонения неверной гипотезы H1).

51.Проверка гипотезы о равенстве математических

ожиданий двух нормальных генеральных совокупностей при известной дисперсии

Проверка гипотез о равенстве двух центров распределения имеет важное практическое значение. Действительно, иногда оказывается, что средний результат одной серии экспериментов заметно отличается от среднего результата другой серии. При этом возникает вопрос: можно ли объяснить обнаруженное расхождение средних случайными ошибками экспериментов или оно вызвано какими-либо незамеченными или даже неизвестными закономерностями.

Сформулируем задачу сравнения двух центров распределения в общем виде. Рассмотрим две случайные величины X и Y , каждая из которых подчиняется нормальному закону распределе-

ния. Пусть имеются две независимые выборки объёмами n1 и n2

из генеральных совокупностей X и Y . Необходимо проверить ги-

потезу

H0, заключающуюся в том, что

M (x)= M (y), относи-

тельно

альтернативной гипотезы H1,

состоящей в том, что

 

M (x)M (y)

 

> 0.

 

 

 

 

 

Так как в рассматриваемом случае дисперсии генеральных

совокупностей σ 2x и σ 2y известны, а о значениях математических

ожиданий M (x) и M (y) ничего неизвестно, то для проверки гипотезы H0 используем их оценки x и y . Как известно, выборочные средние x и y имеют нормальный закон распределения с па-

 

σ 2

 

раметрами M (x);

x

и

 

 

n1

 

 

 

 

 

 

σ

2

 

 

M (y);

 

 

y

 

. Выборки независимы, по-

 

n

 

 

 

2

 

 

 

 

 

 

 

этому x и y также независимы и случайная величина, равная раз-


76

ности между x и y , имеет нормальное распределение, причём

D(x y)= D(x)+ D(y)=

σ x2

+

σ 2y

. Если гипотеза H0 справедли-

 

 

 

 

 

 

 

 

 

n1

 

n2

ва, то M (x y)= M (x)M (y)= 0 , следовательно, нормированная

разность z =

x y

 

 

 

подчиняется нормальному закону с мате-

 

 

 

 

 

 

σ x2

+

σ 2y

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

n

2

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

матическим ожиданием, равным нулю, и дисперсией, равной единице. Выбирая вероятность p =1α из соотношения Ф(zкр)=12α

находим статистику zкр, которая разделит множество z на два

непересекающихся подмножества: область допустимых значений и критическую область. Те значения z , при которых z zкр, об-

разуют область допустимых значений; значения z , для которых z > zкр, определяют критическую область. Иными словами, если

zнаб zкр - нет оснований отвергнуть нулевую гипотезу или при заданном уровне значимости можно считать, что M (x)= M (y), если zнаб > zкр- то нулевую гипотезу отвергаем в пользу конку-

рирующей или при заданном уровне значимости можно считать что математические ожидания генеральных совокупностей различны.

52. Сравнение выборочных средних при неизвестной дисперсии генеральной совокупности.

Рассмотрим две случайные величины X и Y , каждая из которых подчиняется нормальному закону распределения с математическими ожиданиями M (x) и M (y). Условимся считать, что

σ 2x =σ 2y =σ 2 , числовое значение σ 2 неизвестно. Пусть имеются

две независимые выборки объёмами n1 и n2 из генеральных совокупностей X и Y . Необходимо проверить гипотезу H0, заключающуюся в том, что M (x)= M (y), относительно альтернативной гипотезы H1, состоящей в том, что M (x)M (y) > 0. Для оценки


77

M (x) и M (y) используем их оценки x и y , а для оценки σ 2 вы-

борочные оценки: S)x2 =

1

 

(xi x)2

и S)2y

=

1

 

(yi y)2 .

n1 1

n2 1

 

 

и Y

 

 

Так как генеральные совокупности X

имеют одинаковые

дисперсии, то для оценки σ 2 целесообразно использовать результаты обеих выборок. В математической статистике доказано, что

лучшей

оценкой

 

для

σ 2

 

 

в

данном

 

случае

является

)

 

(n

1) S)2 +(n

2

1) S)

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S 2

=

 

1

x

 

 

 

y

.

 

 

В

качестве

выборочной

 

оценки

 

 

n1 +n2 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D(x y)

 

 

 

 

 

 

 

 

 

 

 

 

 

)

2

1

 

 

1

 

)

2

 

обычно принимают оценку

 

 

+

 

 

S

. Из-

 

 

 

 

S(x y)

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1

 

 

n2

 

 

 

 

 

вестно,

что если случайная величина (x y)

подчиняется нор-

мальному закону, то статистика

(x y)M (x y)

 

 

 

 

 

 

 

 

 

 

t =

(x y)M (x y)

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

имеет

 

 

 

S)(x y)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

(n

1) S)2

+(n

2

1) S)

2

 

 

 

 

 

 

 

 

 

 

1

 

+

 

 

1

 

x

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

n +n

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

t - распределения Стьюдента с k = n1 + n2 2 степенями свободы.

Если гипотеза H0 справедлива, то статистику t можно записать в

виде:

t =

 

 

 

 

 

 

 

 

 

 

(x y)

 

 

 

 

 

.

Выбрав

вероят-

 

 

 

1

 

 

1

 

(n 1) S)2 +

(n

2

1) S)2

 

 

 

 

 

 

 

 

 

 

 

+

 

1

x

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n +n

 

2

 

 

 

 

 

 

 

 

 

 

 

n

 

n

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

 

 

 

ность

p =1α ,

по таблице t -распределения можно определить

критическое

 

 

 

значение

tn +n 2;α ,

для

которого

 

P{t

 

> tn +n

 

 

2;α }=α .

1

 

2

 

 

 

 

 

 

 

 

 

Если

 

 

 

вычисленное

значение

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t p

> tn

+n

2

2;α , то с надёжностью p =1α можно считать рас-

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

хождение средних значимым (неслучайным).

Пример 46. В результате двух серий измерений с количеством измерений n1 = 25 и n2 = 50 получены следующие выбороч-

ные средние x = 9,79 и y = 9,60 а также исправленные дисперсии