ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.01.2024
Просмотров: 315
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Таблица 5.1.8
| 1 | 2 | 3 | 4 | 5 | 6 |
1 | 0 | 1,00 | 1,00 | 0,00 | 0,00 | 0,00 |
2 | | 0 | 1,00 | 0,00 | 0,00 | 0,00 |
3 | | | 0 | 0,00 | 0,00 | 0,00 |
4 | | | | 0 | 1,00 | 1,00 |
5 | | | | | 0 | 1,00 |
6 | | | | | | 0 |
Подсчитаем сумму расстояний между объектами:
0+2,83+3,16+10,19+12,17+13,60+
0+ 0+ 3,16+ 8,94+10,77+12,53+
0+ 0+ 0+ 7,07+ 9,06+10,44+
0+ 0+ 0+ 0+ 2+ 3,61+
0+ 0+ 0+ 0+ 0+ 2,24 =111,77.
Среднее расстояние = 111,77/15=7,45.
Сумма расстояний между объектами, вошедшими в кластеры:
1∙2,83+1∙3,16+1∙3,16+1∙2,00+1∙3,61+1∙2,24=17,00.
Среднее расстояние между объектами в кластерах = 17,00/6=2,83.
Сумма расстояний между объектами, находящимися в разных кластерах:
(1-0)∙10,19+(1-0)∙12,17+(1-0)∙13,60+
+(1-0)∙8,94+(1-0)∙10,77+(1-0)∙12,53+
+(1-0)∙7,07+(1-0)∙9,06+ (1-0)∙10,44= 94,77.
Среднее расстояние между объектами, находящимися в разных кластерах
=94,77/9=10,53.
Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.
Пример 5.2
Евклидово расстояние. Наиболее удалённый сосед
Требуется разделить шесть объектов на два кластера. Объекты –
информационные системы характеризуются двумя признаками:
Х1-среднее время решения одной задачи в минутах;
Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.
Значения признаков Х1 и Х2 для объектов представлены в таблице 5.2.1.
Таблица 5.2.1
| 1 | 2 | 3 | 4 | 5 | 6 |
X1 | 2 | 4 | 5 | 12 | 14 | 15 |
X2 | 8 | 10 | 7 | 6 | 6 | 4 |
Вычислены расстояния между объектами по формуле Евклида по всем признакам, которые представлены в таблице 5.2.2.
Таблица 5.2.2
| 1 | 2 | 3 | 4 | 5 | 6 |
1 | 0 | 2,83 | 3,16 | 10,19 | 12,17 | 13,60 |
2 | | 0 | 3,16 | 8,94 | 10,77 | 12,53 |
3 | | | 0 | 7,07 | 9,06 | 10,44 |
4 | | | | 0 | 2,00 | 3,61 |
5 | | | | | 0 | 2,24 |
6 | | | | | | 0 |
Жирным шрифтом в таблице 5.2.2 выделено наименьшее расстояние
между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «наиболее удалённого соседа», применение которого для вычисления расстояния между 1 объектом и формируемым объектом, который состоит из 4 и 5 объектов поясняет рис.5.2.1 .
4
10,19
1
2,00
12,17
5
Рис. 5.2.1
Аналогично определены расстояния между другими объектами и
объектом, состоящим из 4 и 5 объектов, и составлена таблица расстояний 5.2.3
Таблица 5.2.3
| 1 | 2 | 3 | 4,5 | 6 |
1 | 0 | 2,83 | 3,16 | 12,17 | 13,60 |
2 | | 0 | 3,16 | 10,77 | 12,53 |
3 | | | 0 | 9,06 | 10,44 |
4,5 | | | | 0 | 3,61 |
6 | | | | | 0 |
Жирным шрифтом в таблице 5.2.3 выделено наименьшее расстояние
между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по правилу « наиболее удалённого соседа» и представлены в таблице 5.2.4.
Таблица 5.2.4
| 1,2 | 3 | 4,5 | 6 |
1,2 | 0 | 3,16 | 12,17 | 13,60 |
3 | | 0 | 9,06 | 10,44 |
4,5 | | | 0 | 3,61 |
6 | | | | 0 |
Жирным шрифтом в таблице 5.2.4 выделено наименьшее расстояние между объектом 1.2 и третьим объектами. Их объединяем в один объект
1,2,3. Расстояния между этим укрупнённым и другими объектами определены по правилу «наиболее удалённого соседа» и представлены в таблице 5.2.5.
Таблица 5.2.5
| 1,2,3 | 4,5 | 6 |
1,2,3 | 0 | 12,17 | 13,60 |
4,5 | | 0 | 3,61 |
6 | | | 0 |
Жирным шрифтом в таблице 5.2.5 выделено наименьшее расстояние между объединённым объектом 4,5 и шестым объектами. Их объединяем в
один объект 4,5.6. Расстояния между укрупнёнными объектами определены по правилу «наиболее удалённого соседа» и представлены в таблице 5.2.6.
Таблица 5.2.6
| 1,2,3 | 4,5,6 |
1,2,3 | 0 | 13.60 |
4,5,6 | | 0 |
Таким образом процесс кластерного анализа закончен . Выделено два кластера. Расстояние между кластерами равно 13,6. Дендрограмма
результатов кластерного анализа представлена на рис. 5.2.2.
14 Расстояние
13,60
12
. . .
. . .
. . .
4
2
1 2 3 4 5 6
Номера объектов
Рис. 5.2.2
Дендрограмма, представленная на рис 5.2.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.2 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.2.7) и символов Кронекера (таблица 5.2.8).
Таблица 5.2.7
| 1 | 2 | 3 | 4 | 5 | 6 |
1 | 0 | 2,83 | 3,16 | 10,19 | 12,17 | 13,60 |
2 | | 0 | 3,16 | 8,94 | 10,77 | 12,53 |
3 | | | 0 | 7,07 | 9,06 | 10,44 |
4 | | | | 0 | 2,00 | 3,61 |
5 | | | | | 0 | 2,24 |
6 | | | | | | 0 |