ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3654
Скачиваний: 4
Глава
19
Регрессия частично наименьших
квадратов
Процедура Регрессия частично наименьших квадратов оценивает регрессионные
модели частично наименьших квадратов
(PLS),
также известные как модели
“
проекции
на скрытую структуру
”. PLS
представляет собой метод для предсказания
,
который
является альтернативой обычной регрессии наименьших квадратов
(OLS),
каноническим
корреляциям или построению моделей с помощью структурных уравнений
.
Он особенно
полезен
,
когда предикторные переменные сильно коррелированы или когда число
предикторов превышает число наблюдений
.
PLS
соединяет свойства метода главных компонент и множественной регрессии
.
Сначала он выделяет набор скрытых факторов
,
которые объясняют как можно больше
ковариации между независимыми и зависимыми переменными
.
Затем на шаге регрессии
предсказываются значения зависимых переменных с использованием декомпозиции
независимых переменных
.
Доступность.
PLS
является командой расширения
,
которая требует установки
IBM®
SPSS® Statistics - Integration Plug-In for Python
в системе
,
где вы намереваетесь запускать
PLS.
Модуль расширения
PLS
должен быть установлен отдельно
,
а программу установки
можно загрузить с
http://www.ibm.com/developerworks/spssdevcentral
Таблицы.
Доля объясненной дисперсии
(
по скрытым факторам
),
веса скрытых факторов
,
нагрузки скрытых факторов
,
важность независимой переменной в проекции
(VIP - variable
importance in projection),
а также оценки параметров регрессии
(
по зависимым переменным
)
–
всё выводится по умолчанию
.
Диаграммы.
Важность переменной в проекции
(VIP),
значения факторов
,
веса факторов
для первых трех скрытых факторов и расстояние до модели
–
всё выводится посредством
вкладки
.
Шкала измерений.
Зависимые и независимые
(
предикторные
)
переменные могут быть
количественными
,
номинальными или порядковыми
.
Данная процедура предполагает
,
что каждой переменной назначен подходящий тип измерений
,
хотя можно временно
изменить тип измерений для переменной
,
щелкнув правой кнопки мыши на переменной в
списке исходных переменных и выбрав тип измерений из контекстного меню
.
Процедура
одинаково трактует категориальные
(
номинальные и порядковые
)
переменные
.
Кодировка категориальных переменных.
Данная процедура на время выполнения
процедуры перекодирует категориальные зависимые переменные
,
используя кодировку
«
один из
c
».
Если переменная имеет
c
категорий
,
то значения этой переменной хранятся в
виде
c
векторов
,
при этом первой категории приписывается
(1,0,...,0),
следующей категории
- (0,1,0,...,0), ...,
и последней категории
- (0,0,...,0,1).
Категориальные зависимые переменные
представляются с использованием фиктивной кодировки
;
то есть просто опускается
индикатор
,
соответствующий опорной категории
.
© Copyright IBM Corporation 1989, 2011.
132
133
Регрессия частично наименьших квадратов
Частотные веса
Значения весов перед использованием округляются до ближайшего целого
числа
.
Наблюдения с пропущенными весами или весами
,
меньшими
0,5,
в анализе не
используются
.
Пропущенные значения.
Пользовательские и системные пропущенные значения
трактуются как недопустимые
.
Изменение масштаба.
Все переменные в модели
,
включая индикаторные переменные
,
представляющие категориальные переменные
,
центрируются и стандартизуются
.
Для того чтобы получить регрессию частично наименьших квадратов
Выберите в меню
:
Анализ > Регрессия > Частично наименьшие квадраты...
Рисунок 19-1
Вкладка Регрессия частично наименьших квадратов: Переменные
E
Выберите хотя бы одну зависимую переменную
.
E
Выберите хотя бы одну независимую переменную
.
Дополнительно Вы можете
:
Задать опорную категорию для категориальных
(
номинальных и порядковых
)
зависимых переменных
.
134
Глава 19
Задать переменную для использования в качестве однозначного идентификатора для
вывода по наблюдениям и сохраняемых наборов данных
.
Задать верхнюю границу для числа выделяемых скрытых факторов
.
Модель
Рисунок 19-2
Вкладка Регрессия частично наименьших квадратов: Модель
Задать эффекты модели.
Модель главных эффектов содержит все главные эффекты
факторов и ковариат
.
Выберите
Настраиваемая
,
чтобы задать взаимодействия
.
Необходимо
указать все члены
,
включаемые в модель
.
Факторы и ковариаты.
Перечисляются факторы и ковариаты
.
Модель.
Модель зависит от природы ваших данных
.
Выбрав
Настраиваемая
,
вы можете
отобрать главные эффекты и взаимодействия
,
которые представляют интерес для анализа
.
Создать члены
Для выбранных факторов и ковариат
:
Взаимодействие.
Создается член взаимодействия наивысшего порядка всех выбранных
переменных
.
Это задано по умолчанию
.
Главные эффекты.
Создаются главные эффекты для всех выбранных переменных
.
135
Регрессия частично наименьших квадратов
Все 2-факторные.
Создаются все возможные двухфакторные взаимодействия выбранных
переменных
.
Все 3-факторные.
Создаются все возможные трехфакторные взаимодействия выбранных
переменных
.
Все 4-факторные.
Создаются все возможные четырехфакторные взаимодействия
выбранных переменных
.
Все 5-факторные.
Создаются все возможные пятифакторные взаимодействия выбранных
переменных
.
Параметры
Рисунок 19-3
Вкладка Регрессия частично наименьших квадратов: Параметры
Вкладка Параметры позволяет пользователю сохранить и представить графически
модельные оценки для отдельных наблюдений скрытых факторов и предикторов
.
Для каждого типа данных задайте имя набора данных
.
Имена наборов данных должны
быть уникальными
.
Если задать имя существующего набора данных
,
его содержимое
заменяется
;
в противном случае создается новый набор данных
.
136
Глава 19
Сохранить оценки для отдельных наблюдений.
Сохраняются по наблюдениям
следующие модельные оценки
:
предсказанные значения
,
остатки
,
расстояние до модели
скрытых факторов
,
а также значения скрытых факторов
.
Значения скрытых факторов
также представляются графически
.
Сохранить оценки для скрытых факторов.
Сохраняются нагрузки скрытых факторов и
веса скрытых факторов
.
Веса скрытых факторов также представляются графически
.
Сохранить оценки для независимых переменных.
Сохраняются оценки
параметров регрессии и важность переменной в проекции
(VIP).
Значения
VIP
также
представляются графически по скрытых факторам
.