ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.11.2021

Просмотров: 3640

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

102

Глава 15

Предсказанные против наблюденных

Рисунок 15-11

Вид Предсказанные против наблюденных

Выводится диаграмма рассеяния с интервалами для предсказанных значений по
вертикальной оси против наблюденных значений по горизонтальной оси

.

В идеале точки

должны лежать на прямой

,

проведенной под угом

45

градусов

.

Такое представление

позволяет определить

,

есть ли записи

,

которые плохо предсказываются моделью

.


background image

103

Линейные модели

Остатки

Рисунок 15-12

Вид Остатки, стиль гистограммы

Выводится диагностическая диаграмма модельных остатков

.

Стили диаграммы.

Имеются различные стили вывода

,

которые можно выбрать в

выпадающем списке

Стиль

.

Гистограмма.

Это диаграмма рассеяния с интервалами для стьюдентизированных

остатков с наложением нормального распределения

.

Для линейных моделей

предполагается

,

что остатки имеют нормальное распределение

,

поэтому в идеале

гистограмма должна хорошо аппроксимироваться этой гладкой линией

.

P-P диаграмма.

Это диаграмма с интервалами типа вероятность

-

вероятность

,

сравнивающая распределение стьюдентизированных остатков с нормальным
распределением

.

Если наклон выведенных точек менее крутой

,

чем наклон нормальной

кривой

,

то остатки показывают большую изменчивость

,

чем она должна быть для

нормального распределения

.

Если этот наклон более крутой

,

то остатки показывают

меньшую изменчивость

,

чем в случае нормального распределения

.

Если выведенные

точки имеют форму

S-

образной кривой

,

то распределение остатков является

скошенным

.


background image

104

Глава 15

Выбросы

Рисунок 15-13

Вид Остатки

Эта таблица выводит записи

,

которые оказывают чрезмерное влияние на модель

,

а также

выводит

ID

записи

(

если это задано на вкладке Поля

),

значение целевого поля и расстояние

Кука

.

Расстояние Кука

-

это мера того

,

насколько изменились бы остатки для всех

записей

,

если конкретная запись не участвовала бы в вычислении коэффициентов модели

.

Большое расстояние Кука говорит о том

,

что исключение записи существенно изменяет

коэффициенты

,

и должна рассматриваться как влияющая

.

Влияющие записи должны быть тщательно исследованы

,

чтобы определить

,

нужно ли

назначить им меньший вес при оценивании модели или урезать резко выделяющиеся
значения

(

выбросы

)

до некоторого приемлемого порогового значения

,

или же полностью

удалить влияющие записи

.


background image

105

Линейные модели

Эффекты

Рисунок 15-14

Вид Эффекты, стиль диаграммы

Этот вид показывает величину каждого эффекта в модели

.

Стили.

Имеются различные стили вывода

,

которые можно выбрать в выпадающем списке

Стиль

.

Диаграмма.

Это диаграмма

,

в которой эффекты отсортированы сверху вниз по

убыванию важности предикторов

.

Соединяющие линии на диаграмме являются

взвешенными на основе значимости эффектов

,

с большей толщиной линии

,

соответствующей более значимым эффектам

(

меньшим

p

-

значениям

).

При наведении

указателя мыши на соединительную линию появляется всплывающая подсказка

,

выводящая

p

-

значение и значение важности данного эффекта

.

Это задано по

умолчанию

.

Таблица.

Это таблица дисперсионного анализа для общих и индивидуальных эффектов

модели

.

Индивидуальные эффекты отсортированы сверху вниз по убыванию важности

предикторов

.

Обратите внимание на то

,

что по умолчанию таблица сворачивается

,

чтобы показать только результаты для модели в целом

.

Чтобы увидеть результаты для

индивидуальных эффектов модели

,

щелкните по

Скорректированная модель

в ячейке

таблице

.


background image

106

Глава 15

Важность предикторов.

Имеется слайдер важности предикторов

,

который управляет тем

,

какие предикторы выводятся

.

Это не изменяет модели

,

а просто позволяет сосредоточить

внимание на наиболее важных предикторах

.

По умолчанию выводятся

10

верхних

эффектов

.

Значимость.

Имеется слайдер значимости

,

предоставляющий дополнительные

возможности управлять тем

,

какие эффекты выводить

,

кроме тех

,

которые выводятся на

основе значимости предикторов

.

Эффекты со значениями значимости

,

превосходящими

значение слайдера

,

скрыты

.

Это не изменяет модели

,

а просто позволяет сосредоточить

внимание на наиболее важных эффектах

.

По умолчанию это значение равно

1,00,

так что

никакие эффекты не отфильтровываются на основе значимости

.

Коэффициенты

Рисунок 15-15

Вид Коэффициенты, стиль диаграммы

Этот вид показывает значение каждого коэффициента в модели

.

Обратите внимание

на то

,

что факторы

(

категориальные предикторы

)

имеют индикаторную кодировку в

модели

,

так что

эффекты

,

содержащие факторы

,

обычно будут иметь несколько связанных

коэффициентов

,

по одному для каждой категории

,

исключая категорию

,

соответствующую

избыточному

(

опорному

)

параметру

.