ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.04.2021

Просмотров: 1657

Скачиваний: 36

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

106 

Общий, 
скоррек-
тирован-
ный 

 

Коррек-
тиру-
ющий 
фактор, 
обуслов-
ленный 

0

b

 

1

n

 

 
 
 
 

n

i

i

Y

Y

1

2

)

(

 

 
 

)

(

0

b

SS

=

n

Y

n

i

i

2

1

)

(

 

 
 
 
 

 

 

Общий 

 

n

i

i

Y

1

2

 

 
 

 

Сумма 

SS

  редко  подсчитывается  так,  как  показано  в 

таблице,  а  обычно  получается  делением 

)

(

0

1

b

b

SS

  на  общую 

скорректированную 

SS

.  Сумму  квадратов,  обусловленную 

регрессией, 

можно 

вычислять 

множеством 

способов 

(суммирование везде идет по 

n

i

,...

2

,

1

):  

2

0

1

)

(

)

(

Y

Y

b

b

SS

i

=

]

)

)(

(

[

1

Y

Y

X

X

b

i

i

=b

1

S

XY

.    (9.23) 

XX

XY

S

S

2

=

2

2

)

(

]

)

)(

(

[

X

X

Y

Y

X

X

i

i

i

XX

XY

S

S

2

=

 

n

X

X

n

Y

X

Y

X

i

i

i

i

i

i

2

2

2

)

(

]

[

 .                      (9.24) 

XX

XY

S

S

2

=

2

2

)

(

]

)

(

[

X

X

Y

X

X

i

i

i

 . 

Уравнение  (9.23)  проще  всего  использовать,  поскольку 

оба  сомножителя  уже  получены  при  подборе  уравнения 
прямой.  Округление  может  внести  неточности,  лучше 
использовать  формулу  (9.24),  где  деление  производится  в 


background image

 

107 

последний момент. 

Общую  скорректированную  сумму  квадратов  можно 

записать и вычислить следующим образом: 

2

)

(

Y

Y

S

i

YY

=

n

Y

Y

i

i

2

2

)

(

= . 

=

2

2

Y

n

Y

i

 . 

Обозначение 

)

(

0

1

b

b

SS

  читается  так:  «сумма  квадратов 

для 

1

b

  с  учетом  поправки  на 

0

b

».  Средний  квадрат 

относительно  регрессии 

2

s

 

дает  оценку  дисперсии 

относительно  регрессии,  основанную  на  (n-2)  степенях 
свободы. Будем обозначать эту величину 

2

YX

. Если уравнение 

регрессии  будет  оцениваться  из  большого  числа  наблюдений, 
то  дисперсия  относительно  регрессии  будет  представлять 
ошибку  измерения,  с  которой  любое  измеренное 

Y

 

предсказывается  для  данного  значения 

X

  по  известному 

уравнению: 

Исследуем  уравнение  регрессии.  Пока  не  были 

использованы  предположения  о  распределении  вероятностей. 
Теперь введем основные предположения о том, что в модели 

i

i

i

X

Y

1

0

n

i

,...

2

,

1

1)  остаток 

i

  есть  случайная  величина  со  средним,  равным 

нулю, и неизвестной дисперсией 

2

, т.е.  

0

)

(

i

E

2

)

(

i

V

 – англоязычное 

0

)

(

i

M

2

)

(

i

D

 – русское обозначение; 

2)  остатки 

i

  и 

j

  некоррелированы  при 

j

i

,  так  что 

cov

0

)

,

(

j

i

.  Поэтому 

i

i

X

Y

M

1

0

)

(

2

)

(

i

Y

D

  и 

значения 

i

Y

 и 

j

Y

 некоррелированы при 

j

i

3)  остаток 

i

  есть  нормально  распределенная  случайная 

величина со средним нуль и дисперсией 

2

, т.е. 

)

,

0

(

~

2

N

i

.  

При  добавлении  этого  предположения  остатки 

i

  и 

j

 

становятся  не  только  некоррелированными,  но  даже 


background image

 

108 

независимыми 

Замечание 1

.  

Дисперсия 

2

  может  быть  равной  или  не  равной 

2

YX

  – 

дисперсии  относительно  регрессии.  Если  постулированная 
модель  не  соответствует  «истинной»,  то 

2

2

YX

.  Из  этого 

следует,  что 

2

s

  –  остаточный  средний  квадрат,  который  в 

любом  случае  оценивает 

2

YX

  –  служит  оценкой 

2

,  если 

только  модель  корректна.  Если 

2

2

YX

,  то  постулируемая 

модель некорректна или страдает неадекватностью. 

Замечание 2

.  

Во многих реальных ситуациях ошибки, в соответствии с 

центральной предельной теоремой, подчиняются нормальному 
распределению.  Если 

  оказывается  суммой  ошибок,  то, 

независимо  от  того,  как  распределены  отдельные  ошибки,  их 
сумма 

  имеет  тенденцию  к  нормальному  распределению  в 

соответствии с центральной предельной теоремой. 
 

9.5. Интервальное оценивание параметров регрессии 

 

Рассмотрим 

стандартное 

отклонение 

1

b

 

и 

доверительный интервал для 

1

.

  

Мы знаем, что  

 

2

1

)

(

)

)(

(

X

X

Y

Y

X

X

b

i

i

i

=

2

)

(

)

(

X

X

Y

X

X

i

i

i

=

2

1

1

)

(

)

(

...

)

(

X

X

Y

X

X

Y

X

X

i

n

n

Далее, дисперсия некоторой функции 

n

n

Y

a

Y

a

F

...

1

1

 

равна  

)

(

...

)

(

)

(

2

1

2

1

n

n

Y

D

a

Y

D

a

F

D

если 

i

Y

 попарно некоррелированы и 

i

a

 – константы.  


background image

 

109 

Кроме того, если 

2

)

(

i

Y

D

, то  

2

2

2

2

2

1

)

...

(

)

(

i

n

a

a

a

F

D

В выражении для 

1

b

2

)

(

)

(

X

X

X

X

a

i

i

i

,  

так  как 

i

X

  можно  рассматривать  как  константы.  Отсюда, 

после преобразований получаем 

XX

i

S

X

X

b

D

2

2

2

1

)

(

)

(

Стандартное  отклонение 

1

b

  есть  квадратный  корень  из 

дисперсии, т.е. 

2

)

(

X

X

i

.  

Если 

  неизвестна  и  мы  используем  вместо  нее  оценку 

s

предполагая,  что  модель  корректна,  то  оценка  стандартного 
отклонения 

1

b

 есть  

2

)

(

X

X

s

i

Вместо  термина  «оцениваемое  стандартное  отклонение» 

обычно  используют  термин  «стандартная  ошибка».  Если  мы 
предполагаем,  что  разброс  наблюдений  относительно  линии 
нормален,  т.е.  что  ошибки 

j

  все  принадлежат  некоторому 

нормальному  распределению 

)

,

0

(

2

N

,  то  можно  показать, 

что 

)

1

(

100

%  доверительные  интервалы  для 

1

 

получаются, если вычислить  

2

1

)

(

)

2

1

,

2

(

X

X

s

n

t

b

i

,                                  (9.25) 

где 

)

2

1

,

2

(

n

t

  –  это 

)

2

1

(

100

%  точка 

t

-распределения 

Стьюдента с 

2

n

 степенями свободы.  


background image

 

110 

С другой стороны, мы можем проверить нуль  - гипотезу 

о том, что 

10

1

,  

где 

10

 – частное значение, которое может быть нулем против 

альтернативы, что 

1

 отлично от 

10

.  

Обычно пишут: 

10

1

0

:

H

 против 

10

1

1

:

H

.  

Для этого надо вычислить 

s

X

X

t

i

2

10

1

)

(

)

(

                            (9.26) 

и сравнить 

|

|

t

 с 

)

2

1

,

2

(

n

t

 из таблицы 

t

-критерия с 

)

2

(

n

 

степенями свободы – числом, на котором основана оценка 

2

s

 

для 

2

.  В  таком  виде  критерий  будет  двусторонним  с 

100

% процентным уровнем значимости. 

После  того  как  мы  получили  доверительный  интервал 

для 

1

,  уже  нет  необходимости  находить  величину 

|

|

t

  для 

проверки  гипотезы  с  помощью 

t

-критерия.  Достаточно 

исследовать  доверительный  интервал  для 

1

  и  посмотреть, 

содержит  ли  он  значение 

10

.  Если  это  так,  то  гипотезу 

10

1

0

:

H

  нельзя  отвергнуть,  а  если  не  так,  то  она 

отвергается.  Это  можно  увидеть  из  уравнений  (9.26), 

10

1

0

:

H

 

отвергается 

при 

-уровне, 

если 

)

2

1

,

2

(

|

|

n

t

t

, откуда следует, что  

2

10

1

)

(

)

2

1

,

2

(

|

|

X

X

s

n

t

i

т.е.  что 

10

  лежит  за  пределами,  соответствующими 

уравнению (9.25).