ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.11.2021

Просмотров: 3696

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

197

Двухэтапный кластерный анализ

На эти изображения заднего плана накладываются ящичные диаграммы для выбранных
кластеров

:

Для непрерывных показателей квадратные точечные маркеры и горизонтальные линии

показывают медиану и межквартильный размах для каждого кластера

.

Каждый кластер представляется своим цветом

,

показанным в верхней части

изображения

.

Перемещение по средству просмотра кластеров

Средство просмотра кластеров представляет собой интерактивный вывод

.

Вы можете

:

Выбрать поле или кластер

,

чтобы увидеть больше деталей

.

Сравнить кластеры

,

чтобы выбрать элементы

,

представляющие интерес

.

Видоизменить вывод

.

Транспонировать оси

.

Использование панели инструментов.

С помощью панели инструментов можно управлять выводом информации на левой
и правой панелях

.

Пользуясь элементами управления панели инструментов

,

можно

изменять ориентацию вывода

(

сверху вниз

,

слева направо или справа налево

).

Кроме того

,

параметрам средства просмотра можно возвратить значения

,

установленные по умолчанию

,

и открыть диалоговое окно

,

чтобы задать содержимое представления Кластеры в основной

панели

.

Рисунок 24-12

Панели инструментов для управления данными, выводимыми в средстве просмотра кластеров.

Возможность выбрать

Сортировать показатели по

,

Сортировать кластеры по

,

Ячейки

и

Показать

появляется

,

только если выбрать представление

Кластеры

в основной панели

.

Дополнительную информацию см

.

данная тема Вид представления Кластеры на стр

. 189.

Смотрите

Транспонировать кластеры и показатели

на

стр

190

Смотрите

Сортировать показатели по

на стр

191

Смотрите

Сортировать кластеры по

на стр

191

Смотрите

Ячейки

на стр

191

Управление выводом для представления Кластеры

Чтобы получить доступ к управлению тем

,

что показано в представлении Кластеры в

основной панели

,

щелкните по кнопке

Показать

.

Откроется диалоговое окно Показать

.


background image

198

Глава 24

Рисунок 24-13

Средство просмотра кластеров: параметры вывода

Показатели.

Выбрано по умолчанию

.

Чтобы скрыть все входные показатели

,

снимите

этот флажок

.

Поля для оценки.

Выберите поля для оценки

(

поля

,

которые не используются для создания

модели кластеров

,

но посылаются в средство просмотра моделей

,

чтобы оценить качество

кластеров

),

которые будут выведены

.

По умолчанию ни одно не выводится

.

Примечание

:

Этот флажок недоступен

,

если нет ни одного поля для оценки

.

Описания кластеров.

Выбрано по умолчанию

.

Чтобы скрыть все ячейки описания

кластеров

,

снимите этот флажок

.

Размеры кластеров.

Выбрано по умолчанию

.

Чтобы скрыть все ячейки размеров

кластеров

,

снимите этот флажок

.

Максимальное число категорий.

Задайте максимальное число категорий для вывода на

диаграммах категориальных показателей

.

Значение по умолчанию равно

20.

Фильтрация записей

Рисунок 24-14

Средство просмотра кластеров: Отфильтровать наблюдения

При необходимости узнать больше о наблюдениях в отдельном кластере или группе
кластеров можно выбрать подмножество записей для дальнейшего анализа на основе
выбранных кластеров

.


background image

199

Двухэтапный кластерный анализ

E

Выберите кластеры на панели представления Кластеры Средства просмотра кластеров

.

Чтобы выбрать несколько кластеров

,

щелкните мышью с нажатием клавиши

Ctrl .

E

Выберите в меню

:

Создать > Отфильтровать записи...

E

Введите имя фильтрующей переменной

.

Записям из выбранных кластеров в этом поле будет

присвоено значение

1.

Всем остальным записям будет присвоено значение

0,

и они будут

исключены из дальнейшего анализа до тех пор

,

пока не будет изменено состояние фильтра

.

E

Щелкните по

OK

.


background image

Глава

25

Иерархический кластерный

анализ

Эта процедура предназначена для выявления относительно однородных групп наблюдений

(

или переменных

)

по заданным характеристикам при помощи алгоритма

,

который

вначале рассматривает каждое наблюдение

(

переменную

)

как отдельный кластер

,

а

затем последовательно объединяет кластеры

,

пока не останется только один

.

Можно

анализировать исходные переменные или воспользоваться набором стандартизирующих
преобразований

.

Расстояния или меры сходства формируются процедурой Расстояния

(Proximities).

Чтобы помочь в выборе наилучшего решения

,

на каждом шаге выводятся

разнообразные статистики

.

Пример.

Можно ли разбить телевизионные шоу на группы

,

так чтобы в каждой группе

зрители

,

которых они привлекают

,

были схожи

?

С помощью иерархического кластерного

анализа Вы можете разделить

(

кластеризовать

)

телевизионные шоу

(

наблюдения

)

на

однородные группы

,

исходя из характеристик их зрителей

.

Это можно использовать

при сегментации рынка

.

Или Вы можете разбить города

(

наблюдения

)

на однородные

группы

,

что позволит отбирать сравнимые города для проверки различных маркетинговых

стратегий

.

Статистики.

Порядок агломерации

,

матрица расстояний

(

или сходств

)

и состав кластеров

для одного решения или диапазона решений

.

Графики

:

дендрограммы и сосульчатые

диаграммы

.

Данные.

Переменные могут быть количественными

,

бинарными или частотами

.

Масштаб

измерения переменных важен

различия в масштабах могут повлиять на полученные

кластерные решения

.

Если масштаб переменных сильно различается

(

например

,

одна переменная измерена в долларах

,

а другая

в годах

),

то следует подумать об

их стандартизации

(

она может быть проведена автоматически с помощью процедуры

Иерархическая кластерный анализ

).

Порядок наблюдений.

Если во входных данных существуют совпадающие расстояния

или сходства или они появляются в обновленных кластерах в процессе объединения

,

то

результирующее кластерное решение может зависеть от порядка наблюдений в файле
Возможно

,

что вы захотите получить несколько различных решений с наблюдениями

,

упорядоченными случайным образом

,

чтобы проверить стабильность данного решения

.

Предположения.

Используемые расстояния или меры сходства должны соответствовать

анализируемым данным

(

более полную информацию относительно выбора расстояний

и мер сходства можно найти в описании процедуры

Proximities (

Расстояния

)).

Кроме

того

,

в анализ необходимо включать все переменные

,

имеющие отношение к проблеме

.

Игнорирование важных переменных может привести к решению

,

вводящему в заблуждение

.

Поскольку иерархический кластерный анализ является разведочным методом

,

его

результаты следует считать предварительными

,

пока они не будут подтверждены на

независимой выборке

.

© Copyright IBM Corporation 1989, 2011.

200


background image

201

Иерархический кластерный анализ

Как запустить процедуру Иерархический кластерный анализ

E

Выберите в меню

:

Анализ > Классификация > Иерархическая кластеризация...

Рисунок 25-1

Диалоговое окно Иерархический кластерный анализ

E

Если Вы кластеризуете наблюдения

,

выберите

,

по крайней мере

,

одну числовую

переменную

.

При кластеризации переменных выберите

,

по крайней мере

,

три числовые

переменные

.

По желанию можно выбрать идентифицирующую переменную для вывода меток
наблюдений

.