ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.04.2021

Просмотров: 1658

Скачиваний: 36

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

111 

Определим стандартное отклонение свободного члена 

0

b

 и доверительный интервал для 

0

Доверительный  интервал  для 

0

  и  проверку  гипотезы  о 

том, что 

0

 равно или не равно некоторому заданному числу, 

удается  построить  аналогично  тому,  как  было  получено  для 

1

Можем показать, что стандартное отклонение 

0

b

 есть  

2

2

)

(

X

X

n

X

i

i

 . 

Более детально эта формула будет выводиться позже.  
Замена 

  на 

s

  дает  оценку  стандартному  отклонению 

0

b

Отсюда  получаем 

)

1

(

100

%  доверительные  пределы  для 

0

:  

2

2

0

)

(

)

2

1

,

2

(

X

X

n

X

s

n

t

b

i

i

 . 

Критерий 

t

  для  нулевой  гипотезы 

00

0

0

:

H

  против 

альтернативы 

00

0

1

:

H

 где 

00

 – заданное значение,  

будет  отвергать  ее  с 

100

%  уровнем  значимости,  если 

00

 

попадет за доверительные границы, или не будет ее отвергать, 
если 

00

 попадет внутрь интервала.  

Проверку  гипотезы 

0

H

  можно  выполнить  и  иначе, 

находя величину 

2

2

00

0

)

(

)

(

X

X

n

X

s

b

t

i

i

 

и  сравнивая  ее  с  процентной  точкой 

)

2

1

,

2

(

n

t

,  так  как 


background image

 

112 

)

2

(

n

  –  это  число  степеней  свободы,  на  котором  основана 

оценка 

2

s

 для 

2

.  

Возможно 

построение 

совместной 

доверительной 

области для 

0

 и 

1

 одновременно, если применить формулу, 

которая будет получена для многомерных величин. 
 

Стандартное отклонение 

Y

 

Ранее  было  показано,  что  подобранное  уравнение 

регрессии имеет вид 

)

(

1

X

X

b

Y

Y

i

где  как 

Y

,  так  и 

1

b

  подвержены  ошибкам,  которые  будут 

влиять на 

Y

.  

Далее, если 

i

a

 и 

i

c

 – константы и  

n

n

Y

a

Y

a

a

...

1

1

n

n

Y

c

Y

c

c

...

1

1

то,  в  случае  некоррелированности 

i

Y

  и 

j

Y

  при 

j

i

  и  при 

условии 

2

)

(

i

Y

D

 

i

, имеем:  

2

1

1

)

...

(

)

,

cov(

n

n

c

a

c

a

c

a

 . 

Если заменим 

a

 на 

Y

, т.е.  

Y

a

, то это влечет 

n

a

i

1

,  

замена 

1

b

c

 влечет 

2

)

(

X

X

X

X

c

i

i

i

, так что  

0

)

,

cov(

1

b

Y

т.е. 

Y

 и 

1

b

 – некоррелированные случайные величины.  

Поэтому  дисперсия  предсказываемого  среднего  значения 

Y

 

(или 

0

Y

 при заданном 

0

X

) в зависимости от 

X

 есть 

)

(

)

(

)

(

)

(

1

2

0

0

b

V

X

X

Y

D

Y

D

=

2

2

2

0

2

)

(

)

(

X

X

X

X

n

i

Отсюда оценка стандартного отклонения 


background image

 

113 

2

2

0

0

)

(

)

(

1

X

X

X

X

n

s

Y

i

Следовательно,  эта  величина  достигает  минимума,  когда 

X

X

0

 и возрастает, по мере того как мы ―удаляем‖ 

0

X

 от 

X

 

в любом направлении. 

Другими  словами,  чем  больше  разность  между 

0

X

  и 

средним  значением 

X

,  тем  больше  ошибка,  с  которой  мы 

будем предсказывать среднее значение 

Y

 для  данного 

0

X

Следовательно, 

мы 

можем 

ожидать 

наилучшее 

предсказание  в  центре  области  наблюдений 

X

  и  не  должны 

ожидать  хорошего  предсказания  при  удалении  от  центра. 
Дисперсия  и  оценка  стандартного  отклонения,  которые  мы 
рассмотрели,  относятся  к  предсказываемому  среднему 
значению 

Y

 при данном 

0

X

. Так как фактические значения 

Y

 

варьируют около ―истинного‖ среднего значения с дисперсией 

2

  (не  зависимой  от 

)

(

Y

D

),  то  предсказанное  значение 

индивидуального  наблюдения  будет  определяться  величиной 

Y

, но с дисперсией 

]

)

(

)

(

1

1

[

2

2

0

2

X

X

X

X

n

i

Доверительные 

пределы 

можно 

найти 

уже 

рассмотренным способом, Мы вычисляем 95% доверительный 
интервал для нового наблюдения, который будет симметричен 
относительно 

0

Y

  и  длина  которого  будет  зависеть  от  оценки 

этой новой дисперсии 

2

2

0

0

)

(

)

(

1

1

)

975

,

0

,

(

X

X

X

X

n

s

v

t

Y

i

где 

v

  – число  степеней свободы, на котором основана оценка 

2

s

 (здесь это число равно 

)

2

(

n

).  

Доверительный  интервал  для  среднего  из 

q

 

новых 


background image

 

114 

наблюдений 

0

Y

 находится аналогично, исходя из следующего.  

Пусть 

0

Y

 есть средне из 

q

 новых наблюдений при 

0

X

. Тогда  

)

,

(

~

2

0

0

1

0

0

X

N

Y

))

(

,

(

~

0

0

1

0

0

Y

D

X

N

Y

так  что 

))

(

,

0

(

~

0

2

0

0

0

Y

D

N

Y

Y

  и 

(Y

0-

–  Y

0-

)/s

2

  распределено 

как 

)

(

v

t

,  

где 

v

  –  число  степеней  свободы,  на  котором  основана 

2

s

, оценка 

2

.  

Поэтому вероятность 

]

)

(

)

(

1

1

)

975

,

0

,

(

|

[|

2

2

0

2

0

0

X

X

X

X

q

n

s

v

t

Y

Y

i

 =0,95. 

Так что мы можем построить доверительный интервал для 

0

Y

 

относительно 

0

Y

:  

2

2

0

0

)

(

)

(

1

1

)

975

,

0

,

(

X

X

X

X

q

n

s

v

t

Y

i

Эти  пределы,  конечно,  шире,  чем  для  среднего  значения 

Y

 

при  данном 

0

X

  так  как  ожидается,  что  95%  будущих 

наблюдений  при 

0

X

  (для 

1

q

)  или  будущих  средних  из 

наблюдений (для 

q

 >1) лежат внутри них. 

 

F

-критерий значимости регрессии 

 

F

-критерий  известен  из  математической  статистики  и 

может быть использован для исследования моделей регрессии. 
Так  как 

i

Y

  –  случайные  величины,  то  любая  функция  от  них 

тоже будет случайной величиной. Например, две функции:  

R

MS

  –  средний  квадрат,  обусловленный  регрессией,  и 

2

s

  – 

средний  квадрат,  обусловленный  остаточной  вариацией,  тоже 
будут 

случайными. 

Они 

представлены 

в 

таблице 

дисперсионного  анализа.  Эти  функции  имеют  свои 


background image

 

115 

собственные  распределения,  средние,  дисперсии  и  моменты. 
Их средние значения будут:  

2

1

2

)

(

)

(

X

X

MS

E

i

R

2

2

)

(

s

E

где 

E

  означает  среднее  или  математическое  ожидание 

случайной величины.  

Положим,  что  ошибки 

i

  –  независимые  случайные 

величины  с  распределением 

)

,

0

(

2

N

.  Можно  показать,  что 

если 

0

1

,  то  величина 

R

MS

,  умноженная  на  свое  число 

степеней  свободы  (в  данном  случае  на  1),  подчиняется 

2

-

распределению  с  тем  же  самым  числом  степеней  свободы. 
Более  того, 

2

2

)

2

(

s

n

  тоже  имеет 

2

-распределение  с 

)

2

(

n

 степенями свободы.  

Так  как  эти  две  случайные  величины  независимы,  то  из 

статистической теории вытекает, что отношение  

2

s

MS

F

R

  

подчиняется 

F

–  распределению  с  1  и 

)

2

(

n

  степенями 

свободы  при  условии,  что 

0

1

.  Этот  факт  можно 

использовать как критерий выполнимости равенства 

0

1

.  

Мы  должны  сравнить  отношение 

2

s

MS

F

R

  с 

)

1

(

100

табличной точкой 

)

2

,

1

(

n

F

, чтобы посмотреть, можно ли на 

основе  имеющихся  данных  рассматривать 

β

1

   

как  число, 

отличное от нуля. 

Для объяснения доли разброса мы определили, что  

2

2

2

)

(

)

(

Y

Y

Y

Y

R

i

i

где  суммирование  ведется  по 

n

i

,...

2

,

1

.  Тогда 

2

R

  измеряет 

долю 

общего 

разброса 

относительно 

среднего 

Y

объясняемую  регрессией.  Ее  часто  выражают  в  процентах, 
умножая на 100. Фактически 

R

  –  это  корреляция  между 

Y

  и