ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3647
Скачиваний: 4
127
Порядковая регрессия
Создать члены
Для выбранных факторов и ковариат
:
Взаимодействие.
Создает член взаимодействия наивысшего уровня для всех выбранных
переменных
.
Это установлено по умолчанию
.
Главные эффекты.
Создает член главных эффектов для каждой выбранной переменной
.
Все 2-факторные.
Создает все возможные двухфакторные взаимодействия выбранных
переменных
.
Все 3-факторные.
Создает все возможные трехфакторные взаимодействия выбранных
переменных
.
Все 4-факторные.
Создает все возможные четырехфакторные взаимодействия выбранных
переменных
.
Все 5-факторные.
Создает все возможные пятифакторные взаимодействия выбранных
переменных
.
Команда PLUM: дополнительные возможности
В задание на выполнение процедуры порядковой регрессии можно внести изменения путем
передачи его в окно синтаксиса и редактирования полученного синтаксиса команды
PLUM
.
Язык синтаксиса команд также позволяет
:
Формировать гипотезы для проверки путем задания нулевых гипотез
,
включающих
линейные комбинации параметров
.
Обратитесь к
Command Syntax Reference
за полной информацией о синтаксисе языка команд
.
Глава
18
Подгонка кривых
Процедура Подгонка кривых позволяет вычислять статистики и строить сопутствующие
графики для
11
различных регрессионных моделей оценки кривых
.
Для каждой зависимой
переменной будет построена отдельная модель
.
Вы также можете сохранять предсказанные
значения
,
остатки и интервалы прогноза в виде новых переменных
.
Пример.
Провайдер услуг Интернета отслеживает во времени процент зараженного
вирусом почтового трафика в своих сетях
.
Диаграмма рассеивания обнаруживает
нелинейную зависимость
.
Вы можете подогнать к данным квадратичную или кубическую
модель
,
а также проверить выполнение предположений модели и степень ее согласия
.
Статистики.
Для каждой модели
:
коэффициенты регрессии
,
множественный коэффициент
R
,
R
2
,
скорректированный
R
2
,
стандартная ошибка оценки
,
таблица дисперсионного
анализа
,
предсказанные значения
,
остатки и интервалы прогноза
.
Модели
:
линейная
,
логарифмическая
,
обратная
,
квадратичная
,
кубическая
,
степенная
,
составная
, S-
кривая
,
логистическая
,
роста и экспоненциальная
.
Данные.
Зависимая и независимые переменные должны быть количественными
.
Если в
качестве независимой переменной выбрано
Время
,
а не переменная из активного набора
данных
,
процедура Подгонка кривых создаст переменную типа время с одинаковыми
временными интервалами между наблюдениями
.
Если выбрано
Время
,
то зависимая
переменная должна представлять собой временной ряд
.
Для анализа временных рядов
необходима такая структура файла данных
,
в которой каждое наблюдение
(
строка
)
представляет набор измерений
,
сделанных в момент времени
,
отличный от моментов
времени других наблюдений
,
с одинаковыми интервалами времени между соседними
наблюдениями
.
Предположения.
Данные проверяются в графическом режиме
,
чтобы определить
,
как
связаны между собой независимая и зависимая переменные
(
линейно
,
экспоненциально
и т
.
д
.).
Остатки для хорошей модели должны быть распределены случайным образом
и подчиняться нормальному распределению
.
При использовании линейной модели
необходимо выполнение следующих условий
:
Для каждого значения независимой
переменной распределение зависимой переменной должно быть нормальным
.
Дисперсия
распределения зависимой переменной должна быть постоянной для каждого значения
независимой переменной
.
Взаимосвязь между зависимой и независимой переменными
должна быть линейной
,
а все наблюдения должны быть независимыми
.
Как запустить процедуру Подгонка кривых
E
Выберите в меню
:
Анализ > Регрессия > Подгонка кривых...
© Copyright IBM Corporation 1989, 2011.
128
129
Подгонка кривых
Рисунок 18-1
Диалоговое окно Подгонка кривых
E
Выберите одну или несколько зависимых переменных
.
Для каждой зависимой переменной
будет построена отдельная модель
.
E
Выберите независимую переменную
(
либо переменную из активного набора данных
,
либо
Время
).
E
Дополнительно можно
:
Выбрать переменную
,
значения которой задают метки наблюдений в диаграммах
рассеяния
.
Для каждой точки на диаграмме рассеяния использовать инструмент
Идентификатор точек
,
чтобы вывести значение переменной
,
помещенной в поле Метки
наблюдений
.
Щелкнуть мышью по кнопке
Сохранить
,
чтобы сохранить предсказанные значения
,
остатки и интервалы прогноза в качестве новых переменных
.
Доступны также следующие параметры
:
Включить в уравнение константу.
Выполняется оценка свободного члена в уравнении
регрессии
.
Свободный член включается в уравнение по умолчанию
.
Графики моделей.
Для каждой выбранной модели выводится график значений
зависимой переменной от значений независимой переменной
.
Для каждой зависимой
переменной выводится отдельный график
.
Вывести таблицу дисперсионного анализа.
Для каждой выбранной модели выводится
сводная таблица дисперсионного анализа
.
130
Глава 18
Модели подгонки кривых
Вы можете выбрать одну или несколько регрессионных моделей подгонки кривых
.
Чтобы
определить
,
какую модель использовать
,
выведите данные графически
.
Если окажется
,
что
переменные связаны линейно
,
используйте простую модель линейной регрессии
.
Если
переменные не являются связанными линейно
,
попробуйте преобразовать Ваши данные
.
Если преобразование не поможет
,
то
,
возможно
,
необходимо применение более сложной
модели
.
Посмотрите на диаграмму рассеяния данных
.
Если диаграмма напоминает
известную Вам математическую функцию
,
используйте модель соответствующего типа
для подгонки к данным
.
Например
,
если данные на диаграмме напоминают экспоненту
,
используйте экспоненциальную модель
.
Линейная.
Модель
,
задаваемая уравнением
Y = b0 + (b1 * t).
Значения ряда моделируются
линейной функцией времени
.
Логарифмическая.
Модель с уравнением
Y = b0 + (b1 * ln(t)).
Обратная.
Модель
,
задаваемая уравнением
Y = b0 + (b1 / t).
Квадратичная.
Модель
,
задаваемая уравнением
Y = b0 + (b1 * t) + (b2 * t**2).
Квадратичная
модель может применяться в качестве одной из альтернатив линейной модели
,
например
,
когда в ограниченном диапазоне значений наблюдается рост
,
более быстрый
,
чем линейный
.
Кубическая.
Модель
,
определяемая уравнением
Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3).
Степень.
Модель с уравнением
Y = b0 * (t**b1)
или
ln(Y) = ln(b0) + (b1 * ln(t)).
Составная.
Модель
,
задаваемая уравнением
Y = b0 * (b1**t)
или
ln(Y) = ln(b0) + (ln(b1) * t).
S-кривая.
Модель
,
задаваемая уравнением
Y = e**(b0 + (b1/t))
или
ln(Y) = b0 + (b1/t).
Логистическая.
Модель с уравнением
Y = 1 / (1/u + (b0 * (b1**t)))
или
ln(1/Y - 1/u) = ln(b0) +
(ln(b1) * t)) ,
где
u
есть ограничение сверху
.
Выбрав Логистическая
,
задайте границу сверху
,
которая будет использоваться в регрессионном уравнении
.
Это значение должно быть
положительным числом
,
превышающим максимальное значение зависимой переменной
.
Роста.
Модель
,
задаваемая уравнением
Y = e**(b0 + (b1 * t))
или
ln(Y) = b0 + (b1 * t).
Экспоненциальная.
Модель
,
задаваемая уравнением
Y = b0 * (e**(b1 * t))
или
ln(Y) =
ln(b0) + (b1 * t).
131
Подгонка кривых
Подгонка кривых: Сохранить
Рисунок 18-2
Диалоговое окно Подгонка кривых: Сохранить
Сохранить переменные.
Для каждой выбранной модели можно сохранить предсказанные
значения
,
остатки
(
наблюденное значение зависимой переменной минус значение
,
предсказанные моделью
)
и интервалы прогноза
(
верхние и нижние границы
).
Имена и
описательные метки новых переменных отображаются в таблице в окне вывода
.
Прогноз для наблюдений.
Если Вы выбрали
Время
,
а не переменную из активного набора
данных в качестве независимой переменной
,
Вы можете задать период прогноза за концом
временного ряда
.
Вы можете выбрать одну из следующих альтернатив
:
Прогноз до последнего наблюдения.
Предсказывает значения для всех наблюдений в
файле по наблюдениям из периода оценивания
.
Период оценивания
,
отображаемый
внизу диалогового окна
,
задается при помощи диалогового окна Отобрать наблюдения
:
Диапазон
,
вызываемого из диалогового окна Отбор наблюдений
(
меню Данные
,
Отбор наблюдений
).
Если период оценивания не задан
,
для предсказания значений
используются все наблюдения
.
Прогноз до.
Прогнозирует значения до заданной даты
,
времени или номера
наблюдения
,
на основании наблюдений за период оценивания
.
Эта альтернатива
позволяет прогнозировать значения после последнего наблюдения временного ряда
.
То
,
какие поля доступны для задания конца интервала прогнозирования
,
зависит от того
,
какие переменные дат существуют в данных
.
Если переменные дат не заданы
,
Вы
можете указать номер последнего наблюдения
.
Для создания переменных дат используйте пункт Задать данные в меню Данные
.