ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3696
Скачиваний: 4
197
Двухэтапный кластерный анализ
На эти изображения заднего плана накладываются ящичные диаграммы для выбранных
кластеров
:
Для непрерывных показателей квадратные точечные маркеры и горизонтальные линии
показывают медиану и межквартильный размах для каждого кластера
.
Каждый кластер представляется своим цветом
,
показанным в верхней части
изображения
.
Перемещение по средству просмотра кластеров
Средство просмотра кластеров представляет собой интерактивный вывод
.
Вы можете
:
Выбрать поле или кластер
,
чтобы увидеть больше деталей
.
Сравнить кластеры
,
чтобы выбрать элементы
,
представляющие интерес
.
Видоизменить вывод
.
Транспонировать оси
.
Использование панели инструментов.
С помощью панели инструментов можно управлять выводом информации на левой
и правой панелях
.
Пользуясь элементами управления панели инструментов
,
можно
изменять ориентацию вывода
(
сверху вниз
,
слева направо или справа налево
).
Кроме того
,
параметрам средства просмотра можно возвратить значения
,
установленные по умолчанию
,
и открыть диалоговое окно
,
чтобы задать содержимое представления Кластеры в основной
панели
.
Рисунок 24-12
Панели инструментов для управления данными, выводимыми в средстве просмотра кластеров.
Возможность выбрать
Сортировать показатели по
,
Сортировать кластеры по
,
Ячейки
и
Показать
появляется
,
только если выбрать представление
Кластеры
в основной панели
.
данная тема Вид представления Кластеры на стр
Смотрите
Транспонировать кластеры и показатели
на
стр
. 190
Смотрите
на стр
. 191
Смотрите
на стр
. 191
Смотрите
на стр
. 191
Управление выводом для представления Кластеры
Чтобы получить доступ к управлению тем
,
что показано в представлении Кластеры в
основной панели
,
щелкните по кнопке
Показать
.
Откроется диалоговое окно Показать
.
198
Глава 24
Рисунок 24-13
Средство просмотра кластеров: параметры вывода
Показатели.
Выбрано по умолчанию
.
Чтобы скрыть все входные показатели
,
снимите
этот флажок
.
Поля для оценки.
Выберите поля для оценки
(
поля
,
которые не используются для создания
модели кластеров
,
но посылаются в средство просмотра моделей
,
чтобы оценить качество
кластеров
),
которые будут выведены
.
По умолчанию ни одно не выводится
.
Примечание
:
Этот флажок недоступен
,
если нет ни одного поля для оценки
.
Описания кластеров.
Выбрано по умолчанию
.
Чтобы скрыть все ячейки описания
кластеров
,
снимите этот флажок
.
Размеры кластеров.
Выбрано по умолчанию
.
Чтобы скрыть все ячейки размеров
кластеров
,
снимите этот флажок
.
Максимальное число категорий.
Задайте максимальное число категорий для вывода на
диаграммах категориальных показателей
.
Значение по умолчанию равно
20.
Фильтрация записей
Рисунок 24-14
Средство просмотра кластеров: Отфильтровать наблюдения
При необходимости узнать больше о наблюдениях в отдельном кластере или группе
кластеров можно выбрать подмножество записей для дальнейшего анализа на основе
выбранных кластеров
.
199
Двухэтапный кластерный анализ
E
Выберите кластеры на панели представления Кластеры Средства просмотра кластеров
.
Чтобы выбрать несколько кластеров
,
щелкните мышью с нажатием клавиши
Ctrl .
E
Выберите в меню
:
Создать > Отфильтровать записи...
E
Введите имя фильтрующей переменной
.
Записям из выбранных кластеров в этом поле будет
присвоено значение
1.
Всем остальным записям будет присвоено значение
0,
и они будут
исключены из дальнейшего анализа до тех пор
,
пока не будет изменено состояние фильтра
.
E
Щелкните по
OK
.
Глава
25
Иерархический кластерный
анализ
Эта процедура предназначена для выявления относительно однородных групп наблюдений
(
или переменных
)
по заданным характеристикам при помощи алгоритма
,
который
вначале рассматривает каждое наблюдение
(
переменную
)
как отдельный кластер
,
а
затем последовательно объединяет кластеры
,
пока не останется только один
.
Можно
анализировать исходные переменные или воспользоваться набором стандартизирующих
преобразований
.
Расстояния или меры сходства формируются процедурой Расстояния
(Proximities).
Чтобы помочь в выборе наилучшего решения
,
на каждом шаге выводятся
разнообразные статистики
.
Пример.
Можно ли разбить телевизионные шоу на группы
,
так чтобы в каждой группе
зрители
,
которых они привлекают
,
были схожи
?
С помощью иерархического кластерного
анализа Вы можете разделить
(
кластеризовать
)
телевизионные шоу
(
наблюдения
)
на
однородные группы
,
исходя из характеристик их зрителей
.
Это можно использовать
при сегментации рынка
.
Или Вы можете разбить города
(
наблюдения
)
на однородные
группы
,
что позволит отбирать сравнимые города для проверки различных маркетинговых
стратегий
.
Статистики.
Порядок агломерации
,
матрица расстояний
(
или сходств
)
и состав кластеров
для одного решения или диапазона решений
.
Графики
:
дендрограммы и сосульчатые
диаграммы
.
Данные.
Переменные могут быть количественными
,
бинарными или частотами
.
Масштаб
измерения переменных важен
—
различия в масштабах могут повлиять на полученные
кластерные решения
.
Если масштаб переменных сильно различается
(
например
,
одна переменная измерена в долларах
,
а другая
—
в годах
),
то следует подумать об
их стандартизации
(
она может быть проведена автоматически с помощью процедуры
Иерархическая кластерный анализ
).
Порядок наблюдений.
Если во входных данных существуют совпадающие расстояния
или сходства или они появляются в обновленных кластерах в процессе объединения
,
то
результирующее кластерное решение может зависеть от порядка наблюдений в файле
Возможно
,
что вы захотите получить несколько различных решений с наблюдениями
,
упорядоченными случайным образом
,
чтобы проверить стабильность данного решения
.
Предположения.
Используемые расстояния или меры сходства должны соответствовать
анализируемым данным
(
более полную информацию относительно выбора расстояний
и мер сходства можно найти в описании процедуры
Proximities (
Расстояния
)).
Кроме
того
,
в анализ необходимо включать все переменные
,
имеющие отношение к проблеме
.
Игнорирование важных переменных может привести к решению
,
вводящему в заблуждение
.
Поскольку иерархический кластерный анализ является разведочным методом
,
его
результаты следует считать предварительными
,
пока они не будут подтверждены на
независимой выборке
.
© Copyright IBM Corporation 1989, 2011.
200
201
Иерархический кластерный анализ
Как запустить процедуру Иерархический кластерный анализ
E
Выберите в меню
:
Анализ > Классификация > Иерархическая кластеризация...
Рисунок 25-1
Диалоговое окно Иерархический кластерный анализ
E
Если Вы кластеризуете наблюдения
,
выберите
,
по крайней мере
,
одну числовую
переменную
.
При кластеризации переменных выберите
,
по крайней мере
,
три числовые
переменные
.
По желанию можно выбрать идентифицирующую переменную для вывода меток
наблюдений
.