ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.04.2021

Просмотров: 1605

Скачиваний: 34

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

41 

пользу альтернативы. 

 

Задания к лабораторной работе 

 

1.  В  директории  Examples  находится  файл 

adstudy.sta

(поставляемый  с  системой),  в  который  записаны  результаты 
одного  социологического  опроса:  ПОЛ,  ПРЕДПОЧТЕНИЕ: 
PEPSI  или  COKE,  и  другие.  Определить,  зависит  ли 
предпочтение напитка от пола человека. 

Шаг 1.

 Необходимо найти и открыть этот файл в пакете 

STATISTICA  6.0.  Теперь  необходимо  в  Меню  выбора 
основных 

модулей 

обработки 

информации 

выбрать 

Статистика(Statistics)►

Basic Statistics/Tables

Шаг  2.

  В  появившемся  окне  выбрать  пункт 

t-test, 

independent, by groups. 

 

Шаг  3.

  В  окне 

T-Test  for  independent  samples  by  groups

нажав на кнопку Variables, установить следующие значения: 

 

Dependent 

variables 

(зависимая): 

ADVERT (напиток); 

 

Grouping  variables  (группирующая): 
GENDER (пол) 

 

Нажать ОК. 

Шаг  4.

  В  возвратившемся  окне  набрать  в  поле  Code  for 

Group  1:  Male  (мужчины);  в  поле  Code  for  Group  2:  Female 
(женщины) и нажать на кнопку Summary. 

Наблюдаемая  таблица:  в  столбце 

df

  указано  число 

степеней  свободы  -  48,  в  столбце 

t-value

  указано  значение  t 

статистики равное 1,205214, в столбце 

р –

 

уровень, на котором 

можно  отвергнуть  гипотезу.  В  данном  случае 

p  =

  0,234029. 

Это  достаточно  большое  число.  На  основании  его  нельзя 
отвергнуть  гипотезу  о  равенстве  предпочтений  в  выборе 
напитка  у  разных  полов.  Собранные  данные  не  дают 
оснований считать, что пол человека влияет на выбор напитка. 


background image

 

42 

2.  Проверить  гипотезу  о  значимости  ремонта  для 

качества  деталей,  считая  значения  переменной 

d1

  из  файла 

3_1.sta

    контролируемым  размером  диаметра  до  ремонта,  а 

переменной 

d2

 - после ремонта станка. 

3.  Из  данных  (прил.  1)

 

создать  две  переменные  и 

проверить  гипотезу  о  равенстве  средних  для  независимых 
выборок. 

 

Составить отчет по выполненной работе 

 

Отчет по 

выполненной

 работе должен содержать: 

 

Постановку задачи. 

 

Сохраненные на переносном носителе 
информации, созданные в процессе 
выполнения лабораторной работы файлы. 

 

Для наглядности в процессе выполнения 
работы необходимо сделать несколько 
Screen Capture, которые в дальнейшем 
будут размещены в отчете. 

 

Значения  опорных  статистик,  уровней 
значимости и статистические выводы. 

 

Вывод о проделанной работе. 


background image

 

43 

8

.  КРИТЕРИИ СОГЛАСИЯ И ОДНОРОДНОСТИ 

 

Проверка гипотез о виде функции распределения. Критерии 

согласия

 

 

Постановка  задачи.  Пусть 

X

=(X

1

,...,X

n

)  выборка  из 

распределения 

L

(

)  с  неизвестной  функцией  распределения 

F

(x). Выдвигается гипотеза 

 

 

 

 

H

0

: F

(x)=F

0

(x),   

H

1

: F

(x)

F

0

(x) 

против  альтернативы,  где  F

0

(x)  выбирается  из  физических 

соображений 

как 

некоторая 

гипотетическая 

функция 

распределения. Необходимо построить правило, позволяющее 
на основе значений выборки принять или отвергнуть гипотезу 
H

0

Решение:  H

0

  –  простая  гипотеза;  H

1

  –  сложная. 

Формируется некоторая статистика G=g(

X

), которая обладает 

следующими свойствами: 
     1. Обычно G

0; 

     2.  При  альтернативе  G  имеет  значение  большее,  чем  при 
основной гипотезе; 
     3.  Закон  распределения  статистики  G  известен  точно  или 
асимптотически точно (n



) при основной гипотезе. 

Тогда критическая область определяется некоторым значением 
g

кр

, которое находится из условия: 

P(G

g

кр

H

0

)=

Правило принятия решения таково. Если 

g

экс

g

кр



g

экс

<g

кр



0. 

 

 

 

(8.1) 

Это правило называют 

 критерием согласия.

 

 
 
 
 
 
 


background image

 

44 

8.1. Критерий согласия хи - квадрат Пирсона

 

 

Этот  критерий  можно  использовать  для  любых 

распределений,  в  том  числе  и  для  многомерных.  В 
соответствии с этим критерием, область возможных значений 
случайной величины 

  разбивается  на  подобласти  с  помощью 

точек z

0

<z

1

<...z

m

.  

P(z

i-1



 z

i

H

0

)=F

0

(z

i

)-F

0

(z

i-1

)=p

i,

 

i

 - количество элементов выборки, которые попали в интервал 

(z

i-1

,z

i

). 

Формируется статистика  

G

np

np

i

i

i

i

m

(

)

2

1

 , 

где  np

i

  -  теоретическое  число  элементов,  попавших  в  i-тый 

интервал. 

При  достаточно  большом  n  эта  статистика  стремится  к 

2

-распределению с (m-1) степенями свобода:  

G

F

n

m

 



1

2

Таким  образом,  на  основе  статистики  G  можно  построить 
следующее правило: 

g

экс

g

кр



1, 

g

экс

<g

кр



соответствующее  формуле  (8.1)  из  постановки  задачи;  g

кр

 

ищем из условия:   

P(

m

1

2

g

кр

)=

 

P(

m

1

2

g

кр

)=1-P(

m

1

2

<g

кр

)=

,   отсюда имеем: 

g

кр

=

m

 

1 1

2

,

                                  (8.2) 

Формула (8.2) – квантиль распределения 

m

1

2

 порядка 1-

Замечания. 

1.

 

В  используемой  статистике 

G

np

np

i

i

i

i

m

(

)

2

1

 

число  подинтервалов  определяется  из  условия  np

i

10 

или 

i

10.  При  этом  длина  подинтервалов  может  быть 


background image

 

45 

разной.  Значение  z

0

=-

;  z

m

=+

  может  быть,  например, 

при нормальном законе распределения. 

2.

 

При  n

50  можно  считать,  что  статистика  G 

распределена по закону 

2

3.

 

Если  случайная  величина 

  -  дискретная,  то  разбиение 

на подинтервалы осуществляется таким образом, чтобы 
в  каждый  подинтервал  попало  значение  дискретной 
случайной величины. 

4.

 

Критерий  согласия 

2

  можно  использовать  и  тогда, 

когда  распределение  F

0

(x)  известно  с  точностью  до 

параметра  F

0

(x,

).  Если  F

0

(x,

)  и 

=(

1

,...,

s),  то  эти 

параметры  можно  оценить  по  той  же  выборке  и 
подставить  в  функцию  распределения.  Тогда  p

i

F

0

(z

i

,

*

)-F

0

(z

i-1

,

*

), а статистика G

m s

 

1

2

, где s - число 

неизвестных оцениваемых по выборке параметров. 

Пример 1.

 От  аппаратуры, применяемой при проведении 

тиража лотереи, требуется, чтобы для 90 возможных значений 
имелось  равномерное  распределение.  Для  проверки  в  аппарат 
было  положено  5  шаров  и  проведено  n=100  проверочных 
выниманий по одному шару. Распределение F

0

(x) определяется 

в 

соответствии 

с 

предположением 

равномерного 

распределения  пяти  возможных  значений  Х  (Х  -  номер 
вынутого шара) следующей функцией вероятности: p

i

=1/5 (для 

i=1,...,5). Здесь интервалы - сами возможные значения.  
Таблица содержит результаты выниманий 

i

 и данные, нужные 

для вычислений 

2

кр