ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3640
Скачиваний: 4
102
Глава 15
Предсказанные против наблюденных
Рисунок 15-11
Вид Предсказанные против наблюденных
Выводится диаграмма рассеяния с интервалами для предсказанных значений по
вертикальной оси против наблюденных значений по горизонтальной оси
.
В идеале точки
должны лежать на прямой
,
проведенной под угом
45
градусов
.
Такое представление
позволяет определить
,
есть ли записи
,
которые плохо предсказываются моделью
.
103
Линейные модели
Остатки
Рисунок 15-12
Вид Остатки, стиль гистограммы
Выводится диагностическая диаграмма модельных остатков
.
Стили диаграммы.
Имеются различные стили вывода
,
которые можно выбрать в
выпадающем списке
Стиль
.
Гистограмма.
Это диаграмма рассеяния с интервалами для стьюдентизированных
остатков с наложением нормального распределения
.
Для линейных моделей
предполагается
,
что остатки имеют нормальное распределение
,
поэтому в идеале
гистограмма должна хорошо аппроксимироваться этой гладкой линией
.
P-P диаграмма.
Это диаграмма с интервалами типа вероятность
-
вероятность
,
сравнивающая распределение стьюдентизированных остатков с нормальным
распределением
.
Если наклон выведенных точек менее крутой
,
чем наклон нормальной
кривой
,
то остатки показывают большую изменчивость
,
чем она должна быть для
нормального распределения
.
Если этот наклон более крутой
,
то остатки показывают
меньшую изменчивость
,
чем в случае нормального распределения
.
Если выведенные
точки имеют форму
S-
образной кривой
,
то распределение остатков является
скошенным
.
104
Глава 15
Выбросы
Рисунок 15-13
Вид Остатки
Эта таблица выводит записи
,
которые оказывают чрезмерное влияние на модель
,
а также
выводит
ID
записи
(
если это задано на вкладке Поля
),
значение целевого поля и расстояние
Кука
.
Расстояние Кука
-
это мера того
,
насколько изменились бы остатки для всех
записей
,
если конкретная запись не участвовала бы в вычислении коэффициентов модели
.
Большое расстояние Кука говорит о том
,
что исключение записи существенно изменяет
коэффициенты
,
и должна рассматриваться как влияющая
.
Влияющие записи должны быть тщательно исследованы
,
чтобы определить
,
нужно ли
назначить им меньший вес при оценивании модели или урезать резко выделяющиеся
значения
(
выбросы
)
до некоторого приемлемого порогового значения
,
или же полностью
удалить влияющие записи
.
105
Линейные модели
Эффекты
Рисунок 15-14
Вид Эффекты, стиль диаграммы
Этот вид показывает величину каждого эффекта в модели
.
Стили.
Имеются различные стили вывода
,
которые можно выбрать в выпадающем списке
Стиль
.
Диаграмма.
Это диаграмма
,
в которой эффекты отсортированы сверху вниз по
убыванию важности предикторов
.
Соединяющие линии на диаграмме являются
взвешенными на основе значимости эффектов
,
с большей толщиной линии
,
соответствующей более значимым эффектам
(
меньшим
p
-
значениям
).
При наведении
указателя мыши на соединительную линию появляется всплывающая подсказка
,
выводящая
p
-
значение и значение важности данного эффекта
.
Это задано по
умолчанию
.
Таблица.
Это таблица дисперсионного анализа для общих и индивидуальных эффектов
модели
.
Индивидуальные эффекты отсортированы сверху вниз по убыванию важности
предикторов
.
Обратите внимание на то
,
что по умолчанию таблица сворачивается
,
чтобы показать только результаты для модели в целом
.
Чтобы увидеть результаты для
индивидуальных эффектов модели
,
щелкните по
Скорректированная модель
в ячейке
таблице
.
106
Глава 15
Важность предикторов.
Имеется слайдер важности предикторов
,
который управляет тем
,
какие предикторы выводятся
.
Это не изменяет модели
,
а просто позволяет сосредоточить
внимание на наиболее важных предикторах
.
По умолчанию выводятся
10
верхних
эффектов
.
Значимость.
Имеется слайдер значимости
,
предоставляющий дополнительные
возможности управлять тем
,
какие эффекты выводить
,
кроме тех
,
которые выводятся на
основе значимости предикторов
.
Эффекты со значениями значимости
,
превосходящими
значение слайдера
,
скрыты
.
Это не изменяет модели
,
а просто позволяет сосредоточить
внимание на наиболее важных эффектах
.
По умолчанию это значение равно
1,00,
так что
никакие эффекты не отфильтровываются на основе значимости
.
Коэффициенты
Рисунок 15-15
Вид Коэффициенты, стиль диаграммы
Этот вид показывает значение каждого коэффициента в модели
.
Обратите внимание
на то
,
что факторы
(
категориальные предикторы
)
имеют индикаторную кодировку в
модели
,
так что
эффекты
,
содержащие факторы
,
обычно будут иметь несколько связанных
коэффициентов
,
по одному для каждой категории
,
исключая категорию
,
соответствующую
избыточному
(
опорному
)
параметру
.