ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.01.2024
Просмотров: 317
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Таблица 5.2.8
| 1 | 2 | 3 | 4 | 5 | 6 |
1 | 0 | 1,00 | 1,00 | 0,00 | 0,00 | 0,00 |
2 | | 0 | 1,00 | 0,00 | 0,00 | 0,00 |
3 | | | 0 | 0,00 | 0,00 | 0,00 |
4 | | | | 0 | 1,00 | 1,00 |
5 | | | | | 0 | 1,00 |
6 | | | | | | 0 |
Подсчитаем сумму расстояний между объектами:
0+2,83+3,16+10,19+12,17+13,60+
0+ 0+ 3,16+ 8,94+10,77+12,53+
0+ 0+ 0+ 7,07+ 9,06+10,44+
0+ 0+ 0+ 0+ 2+ 3,61+
0+ 0+ 0+ 0+ 0+ 2,24 =111,77.
Среднее расстояние = 111,77/15=7,45.
Сумма расстояний между объектами, вошедшими в кластеры:
1∙2,83+1∙3,16+1∙3,16+1∙2,00+1∙3,61+1∙2,24=17,00.
Среднее расстояние между объектами в кластерах = 17,00/6=2,83.
Сумма расстояний между объектами, находящимися в разных кластерах:
(1-0)∙10,19+(1-0)∙12,17+(1-0)∙13,60+
+(1-0)∙8,94+(1-0)∙10,77+(1-0)∙12,53+
+(1-0)∙7,07+(1-0)∙9,06+ (1-0)∙10,44= 94,77.
Среднее расстояние между объектами, находящимися в разных кластерах
=94,77/9=10,53.
Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.
Пример 5.3
Евклидово расстояние. По среднему значению
Требуется разделить шесть объектов на два кластера. Объекты –
информационные системы характеризуются двумя признаками:
Х1-среднее время решения одной задачи в минутах;
Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.
Значения признаков Х1 и Х2 для шести объектов представлены в таблице 5.3.1.
Таблица 5.3.1
| 1 | 2 | 3 | 4 | 5 | 6 |
X1 | 2 | 4 | 5 | 12 | 14 | 15 |
X2 | 8 | 10 | 7 | 6 | 6 | 4 |
Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 5.3.2.
Таблица 5.3.2
| 1 | 2 | 3 | 4 | 5 | 6 |
1 | 0 | 2,83 | 3,16 | 10,19 | 12,17 | 13,60 |
2 | | 0 | 3,16 | 8,94 | 10,77 | 12,53 |
3 | | | 0 | 7,07 | 9,06 | 10,44 |
4 | | | | 0 | 2,00 | 3,61 |
5 | | | | | 0 | 2,24 |
6 | | | | | | 0 |
Жирным шрифтом в таблице 5.3.2 выделено наименьшее расстояние
между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «среднего значения» и представлены в таблице 5.3.3. Вычисление среднего расстояния пояснено на рис. 5.3.1.
4
3,61
6 m=2,925
2,00
2,24
5
Рис. 5.3.1
Таблица 5.3.3
| 1 | 2 | 3 | 4,5 | 6 |
1 | 0 | 2,83 | 3,16 | 11,18 | 13,60 |
2 | | 0 | 3,16 | 9,855 | 12,53 |
3 | | | 0 | 8,065 | 10,44 |
4,5 | | | | 0 | 2,925 |
6 | | | | | 0 |
Жирным шрифтом в таблице 5.3.3 выделено наименьшее расстояние
между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по принципу « среднего значения» и представлены в таблице 5.3.4.
Таблица 5.3.4
| 1,2 | 3 | 4,5 | 6 |
1,2 | 0 | 3,16 | 10,5175 | 13,065 |
3 | | 0 | 8,0650 | 10,44 |
4,5 | | | 0 | 2,925 |
6 | | | | 0 |
Жирным шрифтом в таблице 5.3.4 выделено наименьшее расстояние между объектом 4,5 и шестым объектом. Их объединяем в один объект 4,5,6. Расстояния между этим укрупнённым и другими объектами определены по
правилу «среднего значения» и представлены в таблице 5.3.5.
Таблица 5.3.5
| 1,2 | 3 | 4,5,6 |
1,2 | 0 | 3,16 | 11,79125 |
3 | | 0 | 9,25250 |
4,5.6 | | | 0 |
Жирным шрифтом в таблице 5.3.5 выделено наименьшее расстояние между объединённым объектом 1,2 и третьим объектом. Их объединяем в
один объект 1,2,3. Расстояния между укрупнёнными объектами определены по правилу «среднего значения» и представлены в таблице 5.3.6.
Таблица 5.3.6
| 1,2,3 | 4,5,6 |
1,2,3 | 0 | 10,521875 |
4,5,6 | | 0 |
Таким образом процесс кластерного анализа закончен. Выделено два
кластера. Расстояние между выделенными кластерами равно 10,52. Дендрограмма результатов кластерного анализа представлена на рис. 5.3.2.
Расстояние
10,52
10
8
6
4
2
1 2 3 4 5 6
Номера объектов
Рис. 5.3.2
Дендрограмма, представленная на рис 5.3.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.3 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.3.7) и символов Кронекера (таблица 5.3.8).
Таблица 5.3.7
| 1 | 2 | 3 | 4 | 5 | 6 |
1 | 0 | 2,83 | 3,16 | 10,19 | 12,17 | 13,60 |
2 | | 0 | 3,16 | 8,94 | 10,77 | 12,53 |
3 | | | 0 | 7,07 | 9,06 | 10,44 |
4 | | | | 0 | 2,00 | 3,61 |
5 | | | | | 0 | 2,24 |
6 | | | | | | 0 |