ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3694
Скачиваний: 4
192
Глава 24
Центры кластеров.
По умолчанию ячейки выводят имена
/
метки показателей и
показатель центральной тенденции для каждой комбинации кластера и показателя
.
Для
непрерывных полей показывается среднее значение
,
а для категориальных полей
-
мода
(
категория
,
которая встречается наиболее часто
)
вместе с процентами по категориям
.
Абсолютные распределения.
Показываются имена
/
метки показателей и абсолютные
распределения показателей внутри каждого кластера
.
Для категориальных показателей
в выводе показываются столбиковые диаграммы для категорий
,
упорядоченных по
возрастанию значений данных
.
Для непрерывных полей в выводе показывается
диаграмма сглаженной плотности
,
в которой используются конечные точки и
интервалы
,
одинаковые для всех кластеров
.
Вывод
,
окрашенный в насыщенный красный цвет
,
показывает распределение для
кластеров
,
тогда как бледный вывод представляет полные данные
.
Относительные распределения.
Показываются имена
/
метки показателей и
относительные распределения в ячейках
.
Вообще эти выводы подобны тем
,
в которых
показываются абсолютные распределения
,
за исключением того
,
что на них выводятся
относительные распределения
.
Вывод
,
окрашенный в насыщенный красный цвет
,
показывает распределение для
кластеров
,
тогда как бледный вывод представляет полные данные
.
Базовое представление.
Когда имеется много кластеров
,
бывает трудно увидеть
все детали
,
не используя прокрутку
.
Чтобы снизить потребность в использовании
прокрутки
,
выберите этот вид представления для вывода таблицы в более компактном
виде
.
193
Двухэтапный кластерный анализ
Вид представления Важность предикторов в кластерах
Рисунок 24-8
Вид представления Важность предикторов в кластерах (в дополнительной панели).
Представление Важность предикторов показывает относительную важность каждого поля
при оценивании модели
.
194
Глава 24
Вид представления Размеры кластеров
Рисунок 24-9
Вид представления Размеры кластеров в дополнительной панели
Представление Размеры кластеров показывает круговую диаграмму
,
содержащую все
кластеры
.
В каждом секторе показывается относительный размер каждого кластера в
процентах
.
Поместите указатель мыши на сектор
,
чтобы вывести частоту в этом секторе
.
Ниже этой диаграммы расположена таблица
,
выводящая следующую информацию о
размерах
:
Размер наименьшего кластера
(
как частота и как процент от целого
).
Размер наибольшего кластера
(
как частота и как процент от целого
).
Отношение размера наибольшего кластера к размеру наименьшего кластера
.
195
Двухэтапный кластерный анализ
Вид представления Распределение в ячейке
Рисунок 24-10
Вид представления Распределение в ячейке в дополнительной панели
Представление Распределение в ячейке выводит расширенную
,
более детальную диаграмму
распределения данных для любой ячейки показателя
,
выбранной в таблице в представлении
Кластеры в основной панели
.
196
Глава 24
Вид представления Сравнение кластеров
Рисунок 24-11
Вид представления Сравнение кластеров на присоединенной панели
Представление Сравнение кластеров имеет форму сетки с показателями в строках и
выбранными кластерами в столбцах
.
Этот вид представления помогает лучше понять
,
какие
факторы формируют кластер
.
Он также позволяет увидеть различие между кластерами
,
не
только в сравнении со всеми данными
,
но и в сравнении между собой
.
Чтобы выбрать кластеры для вывода
,
щелкните по верху столбца кластера в основной
панели в представлении Кластеры
.
Пользуйтесь клавишами
Ctrl
и
Shift
совместно с
щелчком мышью для выбора или отмены выбора нескольких кластеров для сравнения
.
Примечание
:
Можно выбрать для вывода до пяти кластеров
.
Кластеры выводятся в том порядке
,
в котором они были выбраны
,
тогда как порядок полей
определяется параметром
Сортировать показатели по
.
При выборе
по важности для кластера
поля всегда сортируются по общей важности
.
Диаграммы на заднем плане показывают общие распределения каждого показателя
:
Категориальные показатели выводятся в виде точечных диаграмм
,
где для указания
наиболее часто встречающейся
(
модальной
)
категории в каждом кластере
(
по
показателям
)
используется размер точки
.
Непрерывные показатели выводятся в виде ящичных диаграмм
,
которые показывают
общие медианы и межквартильные размахи
.