ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.04.2021
Просмотров: 1657
Скачиваний: 36
106
Общий,
скоррек-
тирован-
ный
Коррек-
тиру-
ющий
фактор,
обуслов-
ленный
0
b
1
n
1
n
i
i
Y
Y
1
2
)
(
)
(
0
b
SS
=
n
Y
n
i
i
2
1
)
(
Общий
n
n
i
i
Y
1
2
Сумма
SS
редко подсчитывается так, как показано в
таблице, а обычно получается делением
)
(
0
1
b
b
SS
на общую
скорректированную
SS
. Сумму квадратов, обусловленную
регрессией,
можно
вычислять
множеством
способов
(суммирование везде идет по
n
i
,...
2
,
1
):
2
0
1
)
(
)
(
Y
Y
b
b
SS
i
=
]
)
)(
(
[
1
Y
Y
X
X
b
i
i
=b
1
S
XY
. (9.23)
XX
XY
S
S
2
=
2
2
)
(
]
)
)(
(
[
X
X
Y
Y
X
X
i
i
i
.
XX
XY
S
S
2
=
n
X
X
n
Y
X
Y
X
i
i
i
i
i
i
2
2
2
)
(
]
[
. (9.24)
XX
XY
S
S
2
=
2
2
)
(
]
)
(
[
X
X
Y
X
X
i
i
i
.
Уравнение (9.23) проще всего использовать, поскольку
оба сомножителя уже получены при подборе уравнения
прямой. Округление может внести неточности, лучше
использовать формулу (9.24), где деление производится в
107
последний момент.
Общую скорректированную сумму квадратов можно
записать и вычислить следующим образом:
2
)
(
Y
Y
S
i
YY
=
n
Y
Y
i
i
2
2
)
(
= .
=
2
2
Y
n
Y
i
.
Обозначение
)
(
0
1
b
b
SS
читается так: «сумма квадратов
для
1
b
с учетом поправки на
0
b
». Средний квадрат
относительно регрессии
2
s
дает оценку дисперсии
относительно регрессии, основанную на (n-2) степенях
свободы. Будем обозначать эту величину
2
YX
. Если уравнение
регрессии будет оцениваться из большого числа наблюдений,
то дисперсия относительно регрессии будет представлять
ошибку измерения, с которой любое измеренное
Y
предсказывается для данного значения
X
по известному
уравнению:
Исследуем уравнение регрессии. Пока не были
использованы предположения о распределении вероятностей.
Теперь введем основные предположения о том, что в модели
i
i
i
X
Y
1
0
,
n
i
,...
2
,
1
:
1) остаток
i
есть случайная величина со средним, равным
нулю, и неизвестной дисперсией
2
, т.е.
0
)
(
i
E
,
2
)
(
i
V
– англоязычное
0
)
(
i
M
,
2
)
(
i
D
– русское обозначение;
2) остатки
i
и
j
некоррелированы при
j
i
, так что
cov
0
)
,
(
j
i
. Поэтому
i
i
X
Y
M
1
0
)
(
,
2
)
(
i
Y
D
и
значения
i
Y
и
j
Y
некоррелированы при
j
i
;
3) остаток
i
есть нормально распределенная случайная
величина со средним нуль и дисперсией
2
, т.е.
)
,
0
(
~
2
N
i
.
При добавлении этого предположения остатки
i
и
j
становятся не только некоррелированными, но даже
108
независимыми
Замечание 1
.
Дисперсия
2
может быть равной или не равной
2
YX
–
дисперсии относительно регрессии. Если постулированная
модель не соответствует «истинной», то
2
2
YX
. Из этого
следует, что
2
s
– остаточный средний квадрат, который в
любом случае оценивает
2
YX
– служит оценкой
2
, если
только модель корректна. Если
2
2
YX
, то постулируемая
модель некорректна или страдает неадекватностью.
Замечание 2
.
Во многих реальных ситуациях ошибки, в соответствии с
центральной предельной теоремой, подчиняются нормальному
распределению. Если
оказывается суммой ошибок, то,
независимо от того, как распределены отдельные ошибки, их
сумма
имеет тенденцию к нормальному распределению в
соответствии с центральной предельной теоремой.
9.5. Интервальное оценивание параметров регрессии
Рассмотрим
стандартное
отклонение
1
b
и
доверительный интервал для
1
.
Мы знаем, что
2
1
)
(
)
)(
(
X
X
Y
Y
X
X
b
i
i
i
=
2
)
(
)
(
X
X
Y
X
X
i
i
i
=
2
1
1
)
(
)
(
...
)
(
X
X
Y
X
X
Y
X
X
i
n
n
.
Далее, дисперсия некоторой функции
n
n
Y
a
Y
a
F
...
1
1
равна
)
(
...
)
(
)
(
2
1
2
1
n
n
Y
D
a
Y
D
a
F
D
,
если
i
Y
попарно некоррелированы и
i
a
– константы.
109
Кроме того, если
2
)
(
i
Y
D
, то
2
2
2
2
2
1
)
...
(
)
(
i
n
a
a
a
F
D
.
В выражении для
1
b
:
2
)
(
)
(
X
X
X
X
a
i
i
i
,
так как
i
X
можно рассматривать как константы. Отсюда,
после преобразований получаем
XX
i
S
X
X
b
D
2
2
2
1
)
(
)
(
.
Стандартное отклонение
1
b
есть квадратный корень из
дисперсии, т.е.
2
)
(
X
X
i
.
Если
неизвестна и мы используем вместо нее оценку
s
,
предполагая, что модель корректна, то оценка стандартного
отклонения
1
b
есть
2
)
(
X
X
s
i
.
Вместо термина «оцениваемое стандартное отклонение»
обычно используют термин «стандартная ошибка». Если мы
предполагаем, что разброс наблюдений относительно линии
нормален, т.е. что ошибки
j
все принадлежат некоторому
нормальному распределению
)
,
0
(
2
N
, то можно показать,
что
)
1
(
100
% доверительные интервалы для
1
получаются, если вычислить
2
1
)
(
)
2
1
,
2
(
X
X
s
n
t
b
i
, (9.25)
где
)
2
1
,
2
(
n
t
– это
)
2
1
(
100
% точка
t
-распределения
Стьюдента с
2
n
степенями свободы.
110
С другой стороны, мы можем проверить нуль - гипотезу
о том, что
10
1
,
где
10
– частное значение, которое может быть нулем против
альтернативы, что
1
отлично от
10
.
Обычно пишут:
10
1
0
:
H
против
10
1
1
:
H
.
Для этого надо вычислить
s
X
X
t
i
2
10
1
)
(
)
(
(9.26)
и сравнить
|
|
t
с
)
2
1
,
2
(
n
t
из таблицы
t
-критерия с
)
2
(
n
степенями свободы – числом, на котором основана оценка
2
s
для
2
. В таком виде критерий будет двусторонним с
100
% процентным уровнем значимости.
После того как мы получили доверительный интервал
для
1
, уже нет необходимости находить величину
|
|
t
для
проверки гипотезы с помощью
t
-критерия. Достаточно
исследовать доверительный интервал для
1
и посмотреть,
содержит ли он значение
10
. Если это так, то гипотезу
10
1
0
:
H
нельзя отвергнуть, а если не так, то она
отвергается. Это можно увидеть из уравнений (9.26),
10
1
0
:
H
отвергается
при
-уровне,
если
)
2
1
,
2
(
|
|
n
t
t
, откуда следует, что
2
10
1
)
(
)
2
1
,
2
(
|
|
X
X
s
n
t
i
,
т.е. что
10
лежит за пределами, соответствующими
уравнению (9.25).