Файл: Нов.ПМС-2.pdf

Скачать файл (2,70Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.04.2021

Просмотров: 1672

Скачиваний: 36

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

126

Таблица 9.5

Уро-
вень







)

(

Чис
ло
степ
еней
своб
оды

Уро-
вень







)

(

Число
степе-
ней
свобо-
ды

1,3

0,125

4,0

0,240

2,0

0,845

4,7

0,260

3,3

2,000

5,3

0,980

3,7

2,000

6,0

0,020

Итого 12,470

Теперь полученные данные можно переписать в таблицу 9.6

дисперсионного анализа.

Таблица .9.6

Дисперсионный анализ (демонстрация неадекватности)

Источ-
ник

Чис
ло
степеней
свобо-
ды

Суммы
квадратов

Средние
квадраты

отношение

Регрессия

6,326

Остаток

21,192

=0,963

Неадекват
-ность

8,722

=0,793

127

Продолжение табл.9.6

«Чистая»
ошибка

12,470

=1,13



=6,569
значимо



=0,05

Общий,
скоррек-
тирован-
ный

27,518



=0,699
не значимо

Неадекватность находится как разность

ОСТАТОК

– SS

ЧИТСАЯ ОШИБКА.

Отношение



=0,699

не  значимо,  так  как  оно  меньше  1.  Поэтому  на  основе  такого
критерия  нет  оснований  сомневаться  в  адекватности  нашей
модели  и  можно  использовать

=0,963 как оценку для



чтобы иметь возможность воспользоваться

- критерием для

проверки значимости всей регрессии.

- критерий

состоятелен, только если нет неадекватности представления
результатов нашей моделью

Итак, в итоге рассмотрим все необходимые действия,

когда наши данные содержат повторные наблюдения.

1) Подобрать модель, составить простую таблицу

дисперсионного анализа с двумя входами: регрессией и
остатком. Но для общей регрессии пока не использовать F -
критерий.

2) Вычислить сумму квадратов, связанную с ―чистой‖

ошибкой, и разложить остаточную сумму квадратов как на
рис. 9.5.

128

3) Применить

- критерий для неадекватности. Если

критерий неадекватности не значим, т.е. нет смысла
сомневаться в адекватности модели, то перейти к пункту 4.б.

4.а) Значимая неадекватность. Прекратить анализ

подобранной модели и искать пути ее улучшения методами
анализа остатков. Не применять

- критерий для общей

регрессии и не пытаться строить доверительные интервалы.
Если нет адекватности подобранной модели, то не верны
предпосылки, которые лежат в основе этих операций.

4.б) Неадекватность не значима. Снова объединить

суммы  квадратов  для  ‖чистых‖  ошибок  и  неадекватности  в
остаточную  сумму  квадратов.  Использовать  остаточный
средний  квадрат

в качестве оценки для

)

(





применить

- критерий для общей регрессии, получить

доверительные пределы для истинного среднего значения

вычислить

и т.д.

Заметим, что если модель проходит все барьеры, это еще

не означает, что она правильна, просто нет оснований считать
ее неадекватной имеющимся данным. Если неадекватность
обнаружена, то может понадобиться другая модель, возможно,
квадратичная, вида













На рис. 9.4 показаны некоторые ситуации, которые могут

возникнуть, когда прямая строится по данным шаг за шагом.

Влияние повторных опытов на R

Мы уже отмечали, что величина

не может достичь 1,

если  есть  повторные  опыты.  Никакая  модель  не  может
изменить  вариацию,  обусловленную  ―чистой‖  ошибкой.  В
нашем  последнем  примере:  сумма  квадратов,  обусловленная
―чистой‖ ошибкой, равна 12,470 при 11 степенях свободы. То,
что модель подогнана к этим данным, не имеет значения, все
равно

величина

12,470

остается

неизменяемой

129

необъясняемой. Следовательно, максимум

, достижимый

при этих данных, есть

общая

обусловл

общая

max





518

470

518



=0,5468,

или 54,68 %.
То значение

, которое фактически достигнуто для

подобранной модели, равно:
R

= SS

РЕГР.

/ общаяSS

скор

= 6,326/27,518=0,2299, или 22,99 %,

Иными словами, мы можем объяснить 0,2299/0,5468=0,4202,
или 42,02 % того, что возможно объяснить.

«Чистая» ошибка в многофакторном случае

Полученные формулы для одной переменной применимы

в общем случае для

предикторов

,...

. Но у повторных

опытов должны совпадать все координаты, т.е., например,
следующие четыре отклика для четырех точек

)

(

)

(

дают повторные опыты. Однако четыре точки

)

(

)

(

уже не дают повторных опытов, поскольку координаты

во

всех этих случаях различны.

Корреляция между переменными

и регрессия

Когда мы выдвигали постулат о линейности модели









то мы предварительно полагали, что

можно выразить как

функцию 1-го порядка от

без учета ошибок.

такой

зависимости

обычно

предполагается

фиксированным

(неслучайным),

т.е.

не

имеющим

вероятностного распределения,

предполагается случайной

величиной, имеющей распределение вероятностей со средним





и дисперсией

)

(



130

Рассмотрим две случайные величины

некоторым

непрерывным

совместным

двумерным

распределением вероятностей

)

(

. Тогда мы определяем

коэффициент корреляции между ними как

)

(

)

(

)

cov(





где

 















dUdW

)

(

))

(

))(

(

)

cov(

 















dUdW

)

(

))

(

)

(

 















dUdW

)

(

)

(

Значения

)

(

М(W)

определяются аналогично в терминах

. Известно, что







. Величина



служит мерой

линейной зависимости между случайными величинами

. Если имеется выборка объема

из величин

)

),...(

(

с совместным распределением, то величина









)

(

)

(

)

)(

(

(9.30)

называется выборочным коэффициентом корреляции между

, оценивает



и представляет собой эмпирическую

меру линейной зависимости между

лежит между -

1 и +1.

Для нашей регрессионной задачи будем рассматривать

. Если корреляция

не равна нулю, это значит, что в

нашем множестве данных существует некоторая линейная
зависимость между конкретными значениями

при

,...



. (Мы предполагаем, что

не подвержены

Смотрите также файлы

Методичка - Диплом 2012.pdf

Probability2.pdf

2seti.pdf

Мет выч методичка.pdf

Первая помощь.pdf

Файл: Нов.ПМС-2.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно