Файл: Проверка статистических гипотез Проверка гипотезы о нормальности распределения.pdf
Добавлен: 06.12.2023
Просмотров: 272
Скачиваний: 12
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Проверка статистических гипотез
Проверка гипотезы о нормальности распределения
H
0 при
Метод вычисления теоретических частот нормального распределения
1. Весь интервал наблюдаемых значений разбиваем на ???????? интервалов одинаковой длины:
[
)
1
;
+
i
i
a
a
,
15 7
≤
≤
l
Вычисляем значения середин интервалов
2 1
+
+
=
i
i
i
a
a
x
2. Вычисляем выборочное среднее значение и оценку дисперсии.
3. Вычисляем значения в концах интервалов:
s
x
a
z
i
i
−
=
и
s
x
a
z
i
i
−
=
+
+
1 1
, причем
−∞
=
1
z
,
+∞
=
+
1
l
z
4. Вычисляем
)
(
)
(
1
i
i
i
z
z
p
Φ
−
Φ
=
+
и
i
теор
i
p
n
m
⋅
=
,
5. Вычисляем
∑
=
−
=
l
i
теор
i
теор
i
i
набл
m
m
m
1
,
2
,
2
)
(
χ
6. Определяем
)
,
(
2
k
кр
α
χ
а) по таблице б)
EXCEL: ХИ2.ОБР.ПХ(????????, ????????).
7. Если
)
,
(
2 2
k
кр
набл
α
χ
χ
<
, то нет оснований отвергнуть гипотезу
0
H
Задача 1. Исходя из гипотезы о нормальном распределении генеральной совокупности, вычислены теоретические частоты m′. Используя критерий Пирсона, при уровне значимости
0,05 проверить эту гипотезу. m
6 12 14 19 15 9
5 m′
7 13 15 17 16 8
4
Задача 2. Исходя из гипотезы о нормальном распределении генеральной совокупности, вычислены теоретические частоты m′. Используя критерий Пирсона, при уровне значимости
0,01 проверить эту гипотезу. m
6 8
13 15 8
5 5 m′
5 7
12 14 9
6 7
Задача 3. Используя критерий Пирсона, при уровне значимости α=0,05 проверить гипотезу о нормальном распределении генеральной совокупности
X
по выборке объема
100
n =
, извлеченной из этой совокупности:
1
+
÷
i
i
a
a
3 1÷
5 3 ÷
7 5 ÷
9 7 ÷
11 9 ÷
i
m
10 20 30 25 15
Задача 4. Используя критерий Пирсона, при уровне значимости 0,05 проверить гипотезу о нормальном распределении генеральной совокупности
X
по выборке объема
80
n =
, извлеченной из этой совокупности:
1
+
÷
i
i
a
a
12 8 ÷
16 12 ÷
20 16 ÷
24 20 ÷
28 24 ÷
i
m
8 15 25 20 12
EXCEL:
F.ОБР.ПХ(∝, ????????
1
, ????????
2
)
Через Анализ данных
Проверка гипотез о равенстве дисперсий
Задача 5. По двум независимым выборкам, объёмы которых
1
n =9 и
2
n =16, извлеченным из нормальных генеральных совокупностей X и Y, найдены исправленные выборочные дисперсии
2 1
s =34.02 и
2 2
s =12.15. При уровне значимости 0,01 проверить нулевую гипотезу Н
0
:
D(X)=D(Y) при конкурирующей гипотезе Н
1
: D(X)>D(Y).
Ответ: F
набл
=2,8; F
кр
(0.01; 8; 15)=4. Нет оснований отвергать нулевую гипотезу.
Задача 6. По двум независимым выборкам, объёмы которых
1
n =14 и
2
n =10, извлеченным из нормальных генеральных совокупностей X и Y, найдены исправленные выборочные
дисперсии
2 1
s =0,84 и
2 2
s =2,52. При уровне значимости 0,1 проверить нулевую гипотезу Н
0
:
D(X)=D(Y) при конкурирующей гипотезе Н
1
: D(X)≠D(Y).
Ответ: F
набл
=3; F
кр
(0,05; 9; 13)=2,72. Нулевую гипотезу следует отвергнуть.
Задача 7. На двух токарных станках обрабатываются втулки. Проверяя точность токарных станков, отобрано18 деталей, обработанных на первом станке, и 13 деталей, обработанных на втором станке. По данным выборки оценены стандартные отклонения как 1,8мм и 3,0мм соответственно. Можно ли на основе выборочных данных при уровне значимости 0,05 утверждать, что первый станок точнее.
Ответ:
38
,
2 78
,
2
=
>
=
кр
B
F
F
. Можно.
Задача 8. Двумя методами проведены измерения одной и той же физической величины.
Получены следующие результаты: для первого способа измерения:
x
i
9,6 10,0 9,8 10,2 10,6; для второго способа измерения:
у
i
10,4 9,7 10,0 10,3.
Можно ли считать, что оба метода обеспечивают одинаковую точность измерений, если принять уровень значимости α=0,1. Предполагается, что результаты распределены нормально и выборки независимы.
Ответ: F
набл
=1,48; F
кр
(0,05; 4; 3)=9,12. Нет оснований отвергать нулевую гипотезу, иными словами, исправленные дисперсии отличаются незначительно и следовательно оба метода обеспечивают одинаковую точность измерений.
Проверка гипотез о сравнении средних значений
(независимые выборки)
Задача 9. По двум независимым выборкам, объемы которых
40 1
=
n
и
50 2
=
n
, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние:
130
=
x
и
140
=
y
. Генеральные дисперсии
80
)
(
2 1
=
=
σ
X
D
,
100
)
(
2 2
=
=
σ
Y
D
. Требуется при уровне значимости 0,01 проверить нулевую гипотезу
)
(
)
(
:
0
Y
M
X
M
H
=
при конкурирующей гипотезе
)
(
)
(
:
1
Y
M
X
M
H
≠
Ответ:
58
,
2
,
5
=
=
кр
B
N
N
. Нулевую гипотезу отвергаем. Выборочные средние различаются значимо.
Задача 10. По выборке объема
30 1
=
n
найден средний вес
130
=
x
г изделий, изготовленных на первом станке, по выборке объема
40 2
=
n
найден средний вес
125
=
y
г изделий, изготовленных на втором станке. Генеральные дисперсии
2 2
1 60
)
(
г
X
D
=
=
σ
,
2 2
2 80
)
(
г
Y
D
=
=
σ
. Требуется при уровне значимости 0,05 проверить нулевую гипотезу
)
(
)
(
:
0
Y
M
X
M
H
=
при конкурирующей гипотезе
)
(
)
(
:
1
Y
M
X
M
H
≠
. Предполагается, что случайные величины распределены нормально и выборки независимы.
Ответ:
96
,1
,
5
,
2
=
=
кр
B
N
N
Нулевую гипотезу отвергаем. Средний вес изделий различается значимо.
Задача 11. При испытании двух типов фильтров для очистки воздуха в объемах 50 штук получены средние значения чистоты воздуха 0,92 и 0,96 соответственно. Проверить при
2 1
s =0,84 и
2 2
s =2,52. При уровне значимости 0,1 проверить нулевую гипотезу Н
0
:
D(X)=D(Y) при конкурирующей гипотезе Н
1
: D(X)≠D(Y).
Ответ: F
набл
=3; F
кр
(0,05; 9; 13)=2,72. Нулевую гипотезу следует отвергнуть.
Задача 7. На двух токарных станках обрабатываются втулки. Проверяя точность токарных станков, отобрано18 деталей, обработанных на первом станке, и 13 деталей, обработанных на втором станке. По данным выборки оценены стандартные отклонения как 1,8мм и 3,0мм соответственно. Можно ли на основе выборочных данных при уровне значимости 0,05 утверждать, что первый станок точнее.
Ответ:
38
,
2 78
,
2
=
>
=
кр
B
F
F
. Можно.
Задача 8. Двумя методами проведены измерения одной и той же физической величины.
Получены следующие результаты: для первого способа измерения:
x
i
9,6 10,0 9,8 10,2 10,6; для второго способа измерения:
у
i
10,4 9,7 10,0 10,3.
Можно ли считать, что оба метода обеспечивают одинаковую точность измерений, если принять уровень значимости α=0,1. Предполагается, что результаты распределены нормально и выборки независимы.
Ответ: F
набл
=1,48; F
кр
(0,05; 4; 3)=9,12. Нет оснований отвергать нулевую гипотезу, иными словами, исправленные дисперсии отличаются незначительно и следовательно оба метода обеспечивают одинаковую точность измерений.
Проверка гипотез о сравнении средних значений
(независимые выборки)
Задача 9. По двум независимым выборкам, объемы которых
40 1
=
n
и
50 2
=
n
, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние:
130
=
x
и
140
=
y
. Генеральные дисперсии
80
)
(
2 1
=
=
σ
X
D
,
100
)
(
2 2
=
=
σ
Y
D
. Требуется при уровне значимости 0,01 проверить нулевую гипотезу
)
(
)
(
:
0
Y
M
X
M
H
=
при конкурирующей гипотезе
)
(
)
(
:
1
Y
M
X
M
H
≠
Ответ:
58
,
2
,
5
=
=
кр
B
N
N
. Нулевую гипотезу отвергаем. Выборочные средние различаются значимо.
Задача 10. По выборке объема
30 1
=
n
найден средний вес
130
=
x
г изделий, изготовленных на первом станке, по выборке объема
40 2
=
n
найден средний вес
125
=
y
г изделий, изготовленных на втором станке. Генеральные дисперсии
2 2
1 60
)
(
г
X
D
=
=
σ
,
2 2
2 80
)
(
г
Y
D
=
=
σ
. Требуется при уровне значимости 0,05 проверить нулевую гипотезу
)
(
)
(
:
0
Y
M
X
M
H
=
при конкурирующей гипотезе
)
(
)
(
:
1
Y
M
X
M
H
≠
. Предполагается, что случайные величины распределены нормально и выборки независимы.
Ответ:
96
,1
,
5
,
2
=
=
кр
B
N
N
Нулевую гипотезу отвергаем. Средний вес изделий различается значимо.
Задача 11. При испытании двух типов фильтров для очистки воздуха в объемах 50 штук получены средние значения чистоты воздуха 0,92 и 0,96 соответственно. Проверить при
уровне значимости 0,05, является ли расхождение значений
x
и
y
случайным, если рассчитанные значения дисперсий соответственно равны 0,09 и 0,04 соответственно.
Ответ: расхождения незначимы, оба фильтра качественно одинаковы.
Задача 12. В заповеднике проводился мониторинг растительности. На пробной площади измерялись диаметры стволов корейского кедра в сантиметрах, после чего были составлены статистические ряды:
1995г.
x
i
12 16 20 24 28 32 36 40 44 48 52 56 60 64
m
i
2 3
20 10 16 32 20 15 0 3
4 0
0 1
2005г.
x
i
12 16 20 24 28 32 36 40 44 48 52 56 60 64
m
i
2 3
7 8
8 25 18 19 7 0
5 0
1 0
Проверить при уровне значимости 0,05 произошли ли изменения в диаметрах стволов корейского кедра. (
)
(
)
(
:
0
Y
M
X
M
H
=
,
)
(
)
(
:
1
Y
M
X
M
H
≠
)
Ответ: произошло
Задача 13. По данным выборки из 10 проб были рассчитаны средняя концентрация анионных
ПАВ, равная 2,5 мг/л, и исправленная дисперсия, равная 0,3. После внесения изменений в технологический процесс, повторно провели 12 проб, в результате которых рассчитали среднюю концентрацию анионных ПАВ и исправленную дисперсию, которые составили соответственно 2,1мг/л и 0,4. При уровне значимости 0,01 значимо ли расхождение в концентрациях ПАВ до и после внесения изменений.
Ответ:
Задача 14. Серия из 5 замеров содержания загрязняющего вещества в сточных водах предприятия показала, что среднее значение
3 7
=
x
мг/л при
5 2
1
=
s
мг/л. Если фоновые (начальные) значения 5 проб показали значение
3 5
=
y
при
5 1
2
=
s
, то значимо ли полученное превышение. Принять
05
,
0
=
α
Ответ: не значимо.
Задача 15. В первой серии наблюдений из 12 проб содержание загрязняющего вещества в почве оценивается как
6
=
x
мг/кг при
3 1
=
s
мг/кг. Через месяц в серии из 16 проб эти показатели составили
8
=
y
мг/кг при
2 2
=
s
мг/кг. Проверьте, произошло ли за месяц увеличение загрязнения почвы при уровне значимости
05
,
0
=
α
Ответ: произошло.
Задача 16. Произведены две выборки урожая пшеницы: при своевременной уборке урожая и уборке с некоторым опозданием. В первом случае при наблюдении 8 участков выборочная средняя урожайность составила 16,2 ц/га с оценкой дисперсии 13,32 (ц/га)
2
. Во втором случае при наблюдении 9 участков урожайность 13,9 ц/га с оценкой дисперсии 5,57 (ц/га)
2
. На уровне значимости 0,05 выяснить влияние своевременности уборки урожая на среднее значение урожайности.
Ответ: имеющиеся выборочные данные на уровне значимости 0,05 не позволяют считать, что некоторое запаздывание в сроках уборки оказывает существенное влияние на величину урожая.
Задача 17. Исследовалась зависимость некоторого параметра, характеризующего эффект изучаемого воздействия, для двух групп пациентов, различающихся группой кровью. В обеих
x
и
y
случайным, если рассчитанные значения дисперсий соответственно равны 0,09 и 0,04 соответственно.
Ответ: расхождения незначимы, оба фильтра качественно одинаковы.
Задача 12. В заповеднике проводился мониторинг растительности. На пробной площади измерялись диаметры стволов корейского кедра в сантиметрах, после чего были составлены статистические ряды:
1995г.
x
i
12 16 20 24 28 32 36 40 44 48 52 56 60 64
m
i
2 3
20 10 16 32 20 15 0 3
4 0
0 1
2005г.
x
i
12 16 20 24 28 32 36 40 44 48 52 56 60 64
m
i
2 3
7 8
8 25 18 19 7 0
5 0
1 0
Проверить при уровне значимости 0,05 произошли ли изменения в диаметрах стволов корейского кедра. (
)
(
)
(
:
0
Y
M
X
M
H
=
,
)
(
)
(
:
1
Y
M
X
M
H
≠
)
Ответ: произошло
Задача 13. По данным выборки из 10 проб были рассчитаны средняя концентрация анионных
ПАВ, равная 2,5 мг/л, и исправленная дисперсия, равная 0,3. После внесения изменений в технологический процесс, повторно провели 12 проб, в результате которых рассчитали среднюю концентрацию анионных ПАВ и исправленную дисперсию, которые составили соответственно 2,1мг/л и 0,4. При уровне значимости 0,01 значимо ли расхождение в концентрациях ПАВ до и после внесения изменений.
Ответ:
Задача 14. Серия из 5 замеров содержания загрязняющего вещества в сточных водах предприятия показала, что среднее значение
3 7
=
x
мг/л при
5 2
1
=
s
мг/л. Если фоновые (начальные) значения 5 проб показали значение
3 5
=
y
при
5 1
2
=
s
, то значимо ли полученное превышение. Принять
05
,
0
=
α
Ответ: не значимо.
Задача 15. В первой серии наблюдений из 12 проб содержание загрязняющего вещества в почве оценивается как
6
=
x
мг/кг при
3 1
=
s
мг/кг. Через месяц в серии из 16 проб эти показатели составили
8
=
y
мг/кг при
2 2
=
s
мг/кг. Проверьте, произошло ли за месяц увеличение загрязнения почвы при уровне значимости
05
,
0
=
α
Ответ: произошло.
Задача 16. Произведены две выборки урожая пшеницы: при своевременной уборке урожая и уборке с некоторым опозданием. В первом случае при наблюдении 8 участков выборочная средняя урожайность составила 16,2 ц/га с оценкой дисперсии 13,32 (ц/га)
2
. Во втором случае при наблюдении 9 участков урожайность 13,9 ц/га с оценкой дисперсии 5,57 (ц/га)
2
. На уровне значимости 0,05 выяснить влияние своевременности уборки урожая на среднее значение урожайности.
Ответ: имеющиеся выборочные данные на уровне значимости 0,05 не позволяют считать, что некоторое запаздывание в сроках уборки оказывает существенное влияние на величину урожая.
Задача 17. Исследовалась зависимость некоторого параметра, характеризующего эффект изучаемого воздействия, для двух групп пациентов, различающихся группой кровью. В обеих
группах было взято по 10 пациентов и получены результаты
x
=8,4 с
2 1
s
=2,28 и ,
y
=11,0 с
2 2
s
=3,10. Проверить при уровне значимости 0,05 являются ли различия средних значений значимы.
Ответ: разница между средними в двух сравниваемых группах статистически достоверна на уровне значимости 0,05.
Проверка гипотез о значении средней
Задача 18. По результатам
9
=
n
замеров установлено, что среднее время изготовления детали
48
=
x
с. Предполагая, что время изготовления – нормально распределенная случайная величина с дисперсией
9 2
=
σ
с
2
на уровне значимости
05
,
0
=
α
решить, можно ли принять
50 в качестве нормативного времени (математического ожидания) изготовления детали?
Ответ: нельзя принять за норматив 50с (гипотезу
0
H
отвергаем).
Задача 19. Дисперсия генеральной совокупности равна 100. Выборка объемом 25 единиц из этой совокупности дала среднюю арифметическую, равную 17. Можем мы принять гипотезу
21
)
(
:
0
=
X
M
H
при конкурирующей гипотезе
21
)
(
:
1
≠
X
M
H
при уровне значимости
0,05?
Ответ: не можем.
Задача 20. В молочном отделе универсама произведено контрольное взвешивание шестнадцать 200-граммовых пачек творога и установлен, что их средний вес 196г. Менеджер отдела выдвигает предположение о недобросовестности поставщика (занижает вес). Прав ли он? По результатам взвешивания рассчитано, что
4
=
s
г. Принять уровень значимости
01
,
0
=
α
Ответ: подозрения менеджера оправданы.
Задача 21. Проектный контролируемый размер изделий, изготовляемых станком-автоматом равен 35 мм. Измерения 20 случайно отобранных изделий дали следующие результаты: контролируемый размер
i
x
34,8 34,9 35,0 35,1 35,3 число изделий
i
m
2 3
4 6
5
Можно ли сказать, что станок обеспечивает проектный размер изделий. Уровень значимости принять равным
05
,
0
=
α
Ответ: можно.
Задача 22. Хронометраж затрат времени на сборку узла машины
20
=
n
слесарей показал, что среднее время
77
=
x
минут, а
0
,
2
=
s
минуты. Можно на уровне значимости
01
,
0
=
α
считать 80 минут нормативом (математическим ожиданием) трудоемкости. (
80
)
(
:
80
)
(
:
1 0
≠
=
X
M
H
X
M
H
).
Ответ: гипотезу
0
H
отвергаем.
Задача 23. Производители нового вида нурофена утверждают, что он снимает головную боль за
10 0
=
a
минут. Случайная выборка
16
=
n
человек, страдающих головными болями показала, что новый тип нурофена снимает головную боль за
12
=
x
минуты при
0 4
=
s
минуты. Проверьте на уровне значимости
05
,
0
=
α
справедливость утверждения производителей нурофена о том, что это лекарство излечивает головную боль за 10 минут.
(
0 1
0 0
)
(
:
)
(
:
a
X
M
H
a
X
M
H
>
=
)
Ответ: утверждение справедливо.
Задача 24. На двух аналитических весах, в одном и том же порядке, взвешены 10 проб химического вещества и получены следующие результаты взвешиваний (в мг):
x
=8,4 с
2 1
s
=2,28 и ,
y
=11,0 с
2 2
s
=3,10. Проверить при уровне значимости 0,05 являются ли различия средних значений значимы.
Ответ: разница между средними в двух сравниваемых группах статистически достоверна на уровне значимости 0,05.
Проверка гипотез о значении средней
Задача 18. По результатам
9
=
n
замеров установлено, что среднее время изготовления детали
48
=
x
с. Предполагая, что время изготовления – нормально распределенная случайная величина с дисперсией
9 2
=
σ
с
2
на уровне значимости
05
,
0
=
α
решить, можно ли принять
50 в качестве нормативного времени (математического ожидания) изготовления детали?
Ответ: нельзя принять за норматив 50с (гипотезу
0
H
отвергаем).
Задача 19. Дисперсия генеральной совокупности равна 100. Выборка объемом 25 единиц из этой совокупности дала среднюю арифметическую, равную 17. Можем мы принять гипотезу
21
)
(
:
0
=
X
M
H
при конкурирующей гипотезе
21
)
(
:
1
≠
X
M
H
при уровне значимости
0,05?
Ответ: не можем.
Задача 20. В молочном отделе универсама произведено контрольное взвешивание шестнадцать 200-граммовых пачек творога и установлен, что их средний вес 196г. Менеджер отдела выдвигает предположение о недобросовестности поставщика (занижает вес). Прав ли он? По результатам взвешивания рассчитано, что
4
=
s
г. Принять уровень значимости
01
,
0
=
α
Ответ: подозрения менеджера оправданы.
Задача 21. Проектный контролируемый размер изделий, изготовляемых станком-автоматом равен 35 мм. Измерения 20 случайно отобранных изделий дали следующие результаты: контролируемый размер
i
x
34,8 34,9 35,0 35,1 35,3 число изделий
i
m
2 3
4 6
5
Можно ли сказать, что станок обеспечивает проектный размер изделий. Уровень значимости принять равным
05
,
0
=
α
Ответ: можно.
Задача 22. Хронометраж затрат времени на сборку узла машины
20
=
n
слесарей показал, что среднее время
77
=
x
минут, а
0
,
2
=
s
минуты. Можно на уровне значимости
01
,
0
=
α
считать 80 минут нормативом (математическим ожиданием) трудоемкости. (
80
)
(
:
80
)
(
:
1 0
≠
=
X
M
H
X
M
H
).
Ответ: гипотезу
0
H
отвергаем.
Задача 23. Производители нового вида нурофена утверждают, что он снимает головную боль за
10 0
=
a
минут. Случайная выборка
16
=
n
человек, страдающих головными болями показала, что новый тип нурофена снимает головную боль за
12
=
x
минуты при
0 4
=
s
минуты. Проверьте на уровне значимости
05
,
0
=
α
справедливость утверждения производителей нурофена о том, что это лекарство излечивает головную боль за 10 минут.
(
0 1
0 0
)
(
:
)
(
:
a
X
M
H
a
X
M
H
>
=
)
Ответ: утверждение справедливо.
Задача 24. На двух аналитических весах, в одном и том же порядке, взвешены 10 проб химического вещества и получены следующие результаты взвешиваний (в мг):
i
x
25 30 28 50 20 40 32 36 42 38
i
y
28 31 26 52 24 36 33 35 45 40
При уровне значимости 0,01 установить, значимо или незначимо различаются результаты взвешиваний.
Ответ:
25
,
3 13
,1 51
,
2 9
,
0
,
=
=
=
−
=
двуст
кр
B
d
T
T
s
d
Результаты взвешивания различаются незначимо.
Задача 25. Физическая подготовка 9 спортсменов была проверена при поступлении в спортивную школу, а затем после недели тренировок. Итоги проверки в баллах оказались следующими:
До
76 71 57 49 70 69 26 65 59
После 81 85 52 52 70 63 33 83 62
Требуется при уровне значимости 0,05 установить, значимо или незначимо улучшилась физическая подготовка спортсменов.
Ответ: Нет оснований считать, что физическая подготовка улучшилась.
Задача 26. Химическая лаборатория произвела в одном и том же порядке анализ 8 проб почвы двумя методами на наличие вещества Ф. Получены следующие результаты (в %):
Первый метод
1,5 2,0 1,6 2,2 2,4 1,4 1,8 2,0
Второй метод
1,5 2,2 1,4 2,5 2,9 1,6 2,0 2,4
Требуется при уровне значимости 0,05 установить, значимо ли или незначимо различаются средние результаты анализов.
Ответ:
36
,
2 57
,
2 7
34 2
,
=
=
=
−
=
двуст
кр
B
d
T
T
s
d
. Результаты анализов различаются значимо.
Таблица 2 значений функции Лапласа Ф(х)=
∫
−
π
x
0 2
t dt e
2 1
2
.
Таблица 5 значений критических точек распределения Пирсона