ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.04.2021
Просмотров: 1660
Скачиваний: 36
41
пользу альтернативы.
Задания к лабораторной работе
1. В директории Examples находится файл
adstudy.sta
,
(поставляемый с системой), в который записаны результаты
одного социологического опроса: ПОЛ, ПРЕДПОЧТЕНИЕ:
PEPSI или COKE, и другие. Определить, зависит ли
предпочтение напитка от пола человека.
Шаг 1.
Необходимо найти и открыть этот файл в пакете
STATISTICA 6.0. Теперь необходимо в Меню выбора
основных
модулей
обработки
информации
выбрать
Статистика(Statistics)►
Basic Statistics/Tables
.
Шаг 2.
В появившемся окне выбрать пункт
t-test,
independent, by groups.
Шаг 3.
В окне
T-Test for independent samples by groups
,
нажав на кнопку Variables, установить следующие значения:
Dependent
variables
(зависимая):
ADVERT (напиток);
Grouping variables (группирующая):
GENDER (пол)
Нажать ОК.
Шаг 4.
В возвратившемся окне набрать в поле Code for
Group 1: Male (мужчины); в поле Code for Group 2: Female
(женщины) и нажать на кнопку Summary.
Наблюдаемая таблица: в столбце
df
указано число
степеней свободы - 48, в столбце
t-value
указано значение t
статистики равное 1,205214, в столбце
р –
уровень, на котором
можно отвергнуть гипотезу. В данном случае
p =
0,234029.
Это достаточно большое число. На основании его нельзя
отвергнуть гипотезу о равенстве предпочтений в выборе
напитка у разных полов. Собранные данные не дают
оснований считать, что пол человека влияет на выбор напитка.
42
2. Проверить гипотезу о значимости ремонта для
качества деталей, считая значения переменной
d1
из файла
3_1.sta
контролируемым размером диаметра до ремонта, а
переменной
d2
- после ремонта станка.
3. Из данных (прил. 1)
создать две переменные и
проверить гипотезу о равенстве средних для независимых
выборок.
Составить отчет по выполненной работе
Отчет по
выполненной
работе должен содержать:
Постановку задачи.
Сохраненные на переносном носителе
информации, созданные в процессе
выполнения лабораторной работы файлы.
Для наглядности в процессе выполнения
работы необходимо сделать несколько
Screen Capture, которые в дальнейшем
будут размещены в отчете.
Значения опорных статистик, уровней
значимости и статистические выводы.
Вывод о проделанной работе.
43
8
. КРИТЕРИИ СОГЛАСИЯ И ОДНОРОДНОСТИ
Проверка гипотез о виде функции распределения. Критерии
согласия
Постановка задачи. Пусть
X
=(X
1
,...,X
n
) выборка из
распределения
L
(
) с неизвестной функцией распределения
F
(x). Выдвигается гипотеза
H
0
: F
(x)=F
0
(x),
H
1
: F
(x)
F
0
(x)
против альтернативы, где F
0
(x) выбирается из физических
соображений
как
некоторая
гипотетическая
функция
распределения. Необходимо построить правило, позволяющее
на основе значений выборки принять или отвергнуть гипотезу
H
0
.
Решение: H
0
– простая гипотеза; H
1
– сложная.
Формируется некоторая статистика G=g(
X
), которая обладает
следующими свойствами:
1. Обычно G
0;
2. При альтернативе G имеет значение большее, чем при
основной гипотезе;
3. Закон распределения статистики G известен точно или
асимптотически точно (n
) при основной гипотезе.
Тогда критическая область определяется некоторым значением
g
кр
, которое находится из условия:
P(G
g
кр
H
0
)=
.
Правило принятия решения таково. Если
g
экс
g
кр
1
g
экс
<g
кр
0.
(8.1)
Это правило называют
критерием согласия.
44
8.1. Критерий согласия хи - квадрат Пирсона
Этот критерий можно использовать для любых
распределений, в том числе и для многомерных. В
соответствии с этим критерием, область возможных значений
случайной величины
разбивается на подобласти с помощью
точек z
0
<z
1
<...z
m
.
P(z
i-1
z
i
H
0
)=F
0
(z
i
)-F
0
(z
i-1
)=p
i,
i
- количество элементов выборки, которые попали в интервал
(z
i-1
,z
i
).
Формируется статистика
G
np
np
i
i
i
i
m
(
)
2
1
,
где np
i
- теоретическое число элементов, попавших в i-тый
интервал.
При достаточно большом n эта статистика стремится к
2
-распределению с (m-1) степенями свобода:
G
F
n
m
1
2
.
Таким образом, на основе статистики G можно построить
следующее правило:
g
экс
g
кр
1,
g
экс
<g
кр
0
соответствующее формуле (8.1) из постановки задачи; g
кр
ищем из условия:
P(
m
1
2
g
кр
)=
P(
m
1
2
g
кр
)=1-P(
m
1
2
<g
кр
)=
, отсюда имеем:
g
кр
=
m
1 1
2
,
(8.2)
Формула (8.2) – квантиль распределения
m
1
2
порядка 1-
.
Замечания.
1.
В используемой статистике
G
np
np
i
i
i
i
m
(
)
2
1
число подинтервалов определяется из условия np
i
10
или
i
10. При этом длина подинтервалов может быть
45
разной. Значение z
0
=-
; z
m
=+
может быть, например,
при нормальном законе распределения.
2.
При n
50 можно считать, что статистика G
распределена по закону
2
.
3.
Если случайная величина
- дискретная, то разбиение
на подинтервалы осуществляется таким образом, чтобы
в каждый подинтервал попало значение дискретной
случайной величины.
4.
Критерий согласия
2
можно использовать и тогда,
когда распределение F
0
(x) известно с точностью до
параметра F
0
(x,
). Если F
0
(x,
) и
=(
1
,...,
s), то эти
параметры можно оценить по той же выборке и
подставить в функцию распределения. Тогда p
i
=
F
0
(z
i
,
*
)-F
0
(z
i-1
,
*
), а статистика G
m s
1
2
, где s - число
неизвестных оцениваемых по выборке параметров.
Пример 1.
От аппаратуры, применяемой при проведении
тиража лотереи, требуется, чтобы для 90 возможных значений
имелось равномерное распределение. Для проверки в аппарат
было положено 5 шаров и проведено n=100 проверочных
выниманий по одному шару. Распределение F
0
(x) определяется
в
соответствии
с
предположением
равномерного
распределения пяти возможных значений Х (Х - номер
вынутого шара) следующей функцией вероятности: p
i
=1/5 (для
i=1,...,5). Здесь интервалы - сами возможные значения.
Таблица содержит результаты выниманий
i
и данные, нужные
для вычислений
2
кр