ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.04.2021
Просмотров: 1663
Скачиваний: 36
121
Объединяя внутренние суммы квадратов для всех серий
повторных опытов, мы получим общую сумму квадратов
«чистых» ошибок в виде
m
j
n
u
j
ju
Y
Y
1
1
2
)
(
со степенями свободы
m
j
j
e
n
n
1
)
1
(
=
m
j
j
m
n
1
.
Отсюда средний квадрат «чистых» ошибок равен
m
j
j
m
j
n
u
j
ju
e
m
n
Y
Y
s
1
1
1
2
2
)
(
и он служит оценкой
2
независимо от того, корректна ли
подобранная модель. Словом, эта величина – полная
SS
между повторениями, деленная на общее число степеней
свободы.
Замечание.
Если имеются два наблюдения
1
j
Y
и
2
j
Y
в точке
j
X
, то
2
1
2
2
1
2
)
(
2
1
)
(
u
j
j
j
ju
Y
Y
Y
Y
. (9.28)
Это удобная форма для вычислений. Такая
SS
имеет только
одну степень свободы.
Таким образом, сумма квадратов «чистых» ошибок
фактически оказывается частью остаточной суммы квадратов,
что мы и покажем.
Остаток для
u
-го наблюдения при
j
X
можно записать
в виде:
)
(
)
(
j
j
j
ju
j
ju
Y
Y
Y
Y
Y
Y
.
Здесь мы пользуемся тем обстоятельством, что все повторные
точки при любом
j
X
имеют одно и то же предсказанное
122
значение
j
Y
. Если мы возведем в квадрат обе части этого
выражения, а затем просуммируем их по
u
и по
j
, то
получим:
m
j
n
u
j
ju
Y
Y
1
1
2
)
(
=
m
j
n
u
m
j
j
j
j
j
ju
Y
Y
n
Y
Y
1
1
1
2
2
)
(
)
(
, (9.29)
причем парные произведения исчезают при суммировании по
u
для каждого
j
. Слева в уравнении (9.29) стоит остаточная
сумма квадратов. Первый член в правой части – это сумма
квадратов «чистых» ошибок. Последний член мы называем
суммой квадратов неадекватности. Отсюда следует, что сумму
квадратов, обусловленную «чистой» ошибкой, можно ввести в
таблицу дисперсионного анализа, как это показано на рис. 9.5.
Рис. 9.5
Затем производится сравнение отношения
2
e
L
s
MS
F
со
)
1
(
100
% точкой
F
-распределения при
)
(
e
n
n
и
e
n
степенях свободы. Если это отношение является:
1) значимым, то это показывает, что модель, по-
видимому, неадекватна и следует изучить, когда и как
встречается неадекватность.
Остаточная
SS
1
n
2
-степеней свободы
Разлагается на:
SS
1
связанная с
неадекватностью,
находится по разности,
n
r
- n
e
степеней свободы
SS
1
связанная с
«чистой» ошибкой по
повторным опытам,
n
e
степеней свободы
Приводит к
MS
L
-
среднему квадрату,
обусловленному
неадекватностью
Приводит к
S
e
2
–
среднему квадрату,
обусловленному
«чистой» ошибкой
Оценка
σ
2
, если модель
корректна;
σ
2
- смещение,
если модель не корректна
Сравнение
Оценка
σ
2
123
2) не значимым, то это показывает, что, по-видимому,
оснований сомневаться в адекватности модели нет, и что как
средний квадрат, связанный с «чистой» ошибкой, так и
средний квадрат, обусловленный неадекватностью, могут
использоваться как оценки
2
.
Объединенная оценка
2
может быть получена из
суммы квадратов, связанной с «чистой» ошибкой, и суммы
квадратов, связанной с неадекватностью, путем объединения
их в остаточную сумму квадратов и деления ее на остаточное
число степеней свободы
r
n
, что дает
r
n
SS
s
2
.
Если используются не повторные опыты в качестве
повторных, то
2
s
будет проявлять склонность к переоценке
2
, а
F
-критерий для проверки неадекватности будет иметь
тенденцию к ошибочному определению ее отсутствия
Пример на иллюстрацию неадекватности и «чистой»
ошибки
В табл. 9.3 представлены результаты 24 наблюдений.
Таблица 9.3
Номер
наб-
лю-
дения
Y
X
Но-
мер
наб-
лю-
дения
Y
X
Но-
мер
наб-
лю-
дения
Y
X
1
2,3 1,3 9
1,7
3,7 17
3,5
5,3
2
1,8 1,3 10
2,8
4,0 18
2,8
5,3
3
2,8 2,0 11
2,8
4,0 19
2,1
5,3
4
1,5 2,0 12
2,2
4,0 20
3,4
5,7
5
2,2 2,7 13
5,4
4,7 21
3,2
6,0
6
3,8 3,3 14
3,2
4,7 22
3,0
6,0
7
1,8 3,3 15
1,9
4,7 23
3,0
6,3
8
3,7 3,7 16
1,8
5,0 24
5,9
6,7
По этим данным была оценена линия регрессии
124
i
i
X
Y
338
,
0
436
,
1
.
Рассчитаем данные для таблицы дисперсионного анализа.
Сумма квадратов, обусловленная регрессией,
2
0
1
)
(
)
(
Y
Y
b
b
SS
i
=
n
X
X
n
Y
X
Y
X
i
i
i
i
i
i
2
2
2
)
(
]
[
=6,326,
(число степеней свободы 1).
Общая (полная) скорректированная сумма квадратов есть
n
Y
Y
s
i
i
YY
2
2
)
(
=27,518,
(число степеней свободы
1
n
=23);
2
)
(
Y
Y
s
i
YY
=27,518;
2
2
Y
n
Y
s
i
YY
.
Остаток считается по формуле
i
i
i
Y
Y
e
, для каждого
наблюдения
i
Y
считается по предложенной прямой
i
Y
=1,436+0,338,
а сумма квадратов для остатков считается по формуле
n
i
i
i
i
Y
Y
e
1
2
)
(
со степенями свободы
2
n
.
Для
примера
2
)
(
i
i
Y
Y
SS
=21,192
(
2
n
=22);
)
2
(
2
n
SS
s
=0,963.
Таблица 9.4
является таблицей дисперсионного анализа.
Сумма квадратов:
1) связанная с ―чистой‖ ошибкой, из повторений при
3
,
1
X
есть
2
)
8
,
1
3
,
2
(
2
1
=0,125 с 1 степенью свободы (использована
формула (9.28);
2) связанная с ―чистой‖ ошибкой, из повторений при
7
,
4
X
(считается по формуле (9.27)
3
)
9
,
1
2
,
3
4
,
5
(
)
9
,
1
(
)
2
,
3
(
)
4
,
5
(
2
2
2
2
=
75
,
36
01
,
43
=6,26с
2 степенями свободы.
125
Таблица 9.4
Источник
Число
степе-
ней
свободы
Суммы
квадра-
тов
SS
Сред-
ние
квадра-
ты
MS
F
-отноше-
ние
Регрессия
1
6,326
6,326
MS
–
средний.
квадрат,
обусловл.
регресс-
сией
Остаток
22
21,192
0,963
2
s
–
средний
квадрат,
обуслов-
ленный
остаточ-
ной вариа-
цией
Общий,
скорректи-
рованный
23
27,518
2
s
MS
F
=6,569
значимо
при
=0,05,
если
нет
неадекват-
ности
Аналогичные вычисления дают следующие величины.