ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.04.2021
Просмотров: 1658
Скачиваний: 36
111
Определим стандартное отклонение свободного члена
0
b
и доверительный интервал для
0
.
Доверительный интервал для
0
и проверку гипотезы о
том, что
0
равно или не равно некоторому заданному числу,
удается построить аналогично тому, как было получено для
1
.
Можем показать, что стандартное отклонение
0
b
есть
2
2
)
(
X
X
n
X
i
i
.
Более детально эта формула будет выводиться позже.
Замена
на
s
дает оценку стандартному отклонению
0
b
.
Отсюда получаем
)
1
(
100
% доверительные пределы для
0
:
2
2
0
)
(
)
2
1
,
2
(
X
X
n
X
s
n
t
b
i
i
.
Критерий
t
для нулевой гипотезы
00
0
0
:
H
против
альтернативы
00
0
1
:
H
,
где
00
– заданное значение,
будет отвергать ее с
100
% уровнем значимости, если
00
попадет за доверительные границы, или не будет ее отвергать,
если
00
попадет внутрь интервала.
Проверку гипотезы
0
H
можно выполнить и иначе,
находя величину
2
2
00
0
)
(
)
(
X
X
n
X
s
b
t
i
i
и сравнивая ее с процентной точкой
)
2
1
,
2
(
n
t
, так как
112
)
2
(
n
– это число степеней свободы, на котором основана
оценка
2
s
для
2
.
Возможно
построение
совместной
доверительной
области для
0
и
1
одновременно, если применить формулу,
которая будет получена для многомерных величин.
Стандартное отклонение
Y
Ранее было показано, что подобранное уравнение
регрессии имеет вид
)
(
1
X
X
b
Y
Y
i
,
где как
Y
, так и
1
b
подвержены ошибкам, которые будут
влиять на
Y
.
Далее, если
i
a
и
i
c
– константы и
n
n
Y
a
Y
a
a
...
1
1
,
n
n
Y
c
Y
c
c
...
1
1
,
то, в случае некоррелированности
i
Y
и
j
Y
при
j
i
и при
условии
2
)
(
i
Y
D
i
, имеем:
2
1
1
)
...
(
)
,
cov(
n
n
c
a
c
a
c
a
.
Если заменим
a
на
Y
, т.е.
Y
a
, то это влечет
n
a
i
1
,
замена
1
b
c
влечет
2
)
(
X
X
X
X
c
i
i
i
, так что
0
)
,
cov(
1
b
Y
,
т.е.
Y
и
1
b
– некоррелированные случайные величины.
Поэтому дисперсия предсказываемого среднего значения
Y
(или
0
Y
при заданном
0
X
) в зависимости от
X
есть
)
(
)
(
)
(
)
(
1
2
0
0
b
V
X
X
Y
D
Y
D
=
2
2
2
0
2
)
(
)
(
X
X
X
X
n
i
.
Отсюда оценка стандартного отклонения
113
2
2
0
0
)
(
)
(
1
X
X
X
X
n
s
Y
i
.
Следовательно, эта величина достигает минимума, когда
X
X
0
и возрастает, по мере того как мы ―удаляем‖
0
X
от
X
в любом направлении.
Другими словами, чем больше разность между
0
X
и
средним значением
X
, тем больше ошибка, с которой мы
будем предсказывать среднее значение
Y
для данного
0
X
.
Следовательно,
мы
можем
ожидать
наилучшее
предсказание в центре области наблюдений
X
и не должны
ожидать хорошего предсказания при удалении от центра.
Дисперсия и оценка стандартного отклонения, которые мы
рассмотрели, относятся к предсказываемому среднему
значению
Y
при данном
0
X
. Так как фактические значения
Y
варьируют около ―истинного‖ среднего значения с дисперсией
2
(не зависимой от
)
(
Y
D
), то предсказанное значение
индивидуального наблюдения будет определяться величиной
Y
, но с дисперсией
]
)
(
)
(
1
1
[
2
2
0
2
X
X
X
X
n
i
.
Доверительные
пределы
можно
найти
уже
рассмотренным способом, Мы вычисляем 95% доверительный
интервал для нового наблюдения, который будет симметричен
относительно
0
Y
и длина которого будет зависеть от оценки
этой новой дисперсии
2
2
0
0
)
(
)
(
1
1
)
975
,
0
,
(
X
X
X
X
n
s
v
t
Y
i
,
где
v
– число степеней свободы, на котором основана оценка
2
s
(здесь это число равно
)
2
(
n
).
Доверительный интервал для среднего из
q
новых
114
наблюдений
0
Y
находится аналогично, исходя из следующего.
Пусть
0
Y
есть средне из
q
новых наблюдений при
0
X
. Тогда
)
,
(
~
2
0
0
1
0
0
X
N
Y
,
))
(
,
(
~
0
0
1
0
0
Y
D
X
N
Y
,
так что
))
(
,
0
(
~
0
2
0
0
0
Y
D
N
Y
Y
и
(Y
0-
– Y
0-
)/s
2
распределено
как
)
(
v
t
,
где
v
– число степеней свободы, на котором основана
2
s
, оценка
2
.
Поэтому вероятность
]
)
(
)
(
1
1
)
975
,
0
,
(
|
[|
2
2
0
2
0
0
X
X
X
X
q
n
s
v
t
Y
Y
i
=0,95.
Так что мы можем построить доверительный интервал для
0
Y
относительно
0
Y
:
2
2
0
0
)
(
)
(
1
1
)
975
,
0
,
(
X
X
X
X
q
n
s
v
t
Y
i
.
Эти пределы, конечно, шире, чем для среднего значения
Y
при данном
0
X
так как ожидается, что 95% будущих
наблюдений при
0
X
(для
1
q
) или будущих средних из
q
наблюдений (для
q
>1) лежат внутри них.
F
-критерий значимости регрессии
F
-критерий известен из математической статистики и
может быть использован для исследования моделей регрессии.
Так как
i
Y
– случайные величины, то любая функция от них
тоже будет случайной величиной. Например, две функции:
R
MS
– средний квадрат, обусловленный регрессией, и
2
s
–
средний квадрат, обусловленный остаточной вариацией, тоже
будут
случайными.
Они
представлены
в
таблице
дисперсионного анализа. Эти функции имеют свои
115
собственные распределения, средние, дисперсии и моменты.
Их средние значения будут:
2
1
2
)
(
)
(
X
X
MS
E
i
R
,
2
2
)
(
s
E
,
где
E
означает среднее или математическое ожидание
случайной величины.
Положим, что ошибки
i
– независимые случайные
величины с распределением
)
,
0
(
2
N
. Можно показать, что
если
0
1
, то величина
R
MS
, умноженная на свое число
степеней свободы (в данном случае на 1), подчиняется
2
-
распределению с тем же самым числом степеней свободы.
Более того,
2
2
)
2
(
s
n
тоже имеет
2
-распределение с
)
2
(
n
степенями свободы.
Так как эти две случайные величины независимы, то из
статистической теории вытекает, что отношение
2
s
MS
F
R
подчиняется
F
– распределению с 1 и
)
2
(
n
степенями
свободы при условии, что
0
1
. Этот факт можно
использовать как критерий выполнимости равенства
0
1
.
Мы должны сравнить отношение
2
s
MS
F
R
с
)
1
(
100
%
табличной точкой
)
2
,
1
(
n
F
, чтобы посмотреть, можно ли на
основе имеющихся данных рассматривать
β
1
как число,
отличное от нуля.
Для объяснения доли разброса мы определили, что
2
2
2
)
(
)
(
Y
Y
Y
Y
R
i
i
,
где суммирование ведется по
n
i
,...
2
,
1
. Тогда
2
R
измеряет
долю
общего
разброса
относительно
среднего
Y
,
объясняемую регрессией. Ее часто выражают в процентах,
умножая на 100. Фактически
R
– это корреляция между
Y
и