Файл: Пример задания 1.doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 12.01.2024

Просмотров: 317

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


Таблица 5.2.8




1

2

3

4

5

6

1

0

1,00

1,00

0,00

0,00

0,00

2




0

1,00

0,00

0,00

0,00

3







0

0,00

0,00

0,00

4










0

1,00

1,00

5













0

1,00

6
















0


Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:
1∙2,83+1∙3,16+1∙3,16+1∙2,00+1∙3,61+1∙2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)∙10,19+(1-0)∙12,17+(1-0)∙13,60+

+(1-0)∙8,94+(1-0)∙10,77+(1-0)∙12,53+

+(1-0)∙7,07+(1-0)∙9,06+ (1-0)∙10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.


Пример 5.3

Евклидово расстояние. По среднему значению
Требуется разделить шесть объектов на два кластера. Объекты –

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 5.3.1.


Таблица 5.3.1




1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4


Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 5.3.2.

Таблица 5.3.2




1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2




0

3,16

8,94

10,77

12,53

3







0

7,07

9,06

10,44

4










0

2,00

3,61

5













0

2,24

6
















0


Жирным шрифтом в таблице 5.3.2 выделено наименьшее расстояние



между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «среднего значения» и представлены в таблице 5.3.3. Вычисление среднего расстояния пояснено на рис. 5.3.1.

4

3,61

6 m=2,925

2,00

2,24

5
Рис. 5.3.1

Таблица 5.3.3




1

2

3

4,5

6

1

0

2,83

3,16

11,18

13,60

2




0

3,16

9,855

12,53

3







0

8,065

10,44

4,5










0

2,925

6













0



Жирным шрифтом в таблице 5.3.3 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по принципу « среднего значения» и представлены в таблице 5.3.4.

Таблица 5.3.4




1,2

3

4,5

6

1,2

0

3,16

10,5175

13,065

3




0

8,0650

10,44

4,5







0

2,925

6










0


Жирным шрифтом в таблице 5.3.4 выделено наименьшее расстояние между объектом 4,5 и шестым объектом. Их объединяем в один объект 4,5,6. Расстояния между этим укрупнённым и другими объектами определены по


правилу «среднего значения» и представлены в таблице 5.3.5.

Таблица 5.3.5




1,2

3

4,5,6

1,2

0

3,16

11,79125

3




0

9,25250

4,5.6







0


Жирным шрифтом в таблице 5.3.5 выделено наименьшее расстояние между объединённым объектом 1,2 и третьим объектом. Их объединяем в

один объект 1,2,3. Расстояния между укрупнёнными объектами определены по правилу «среднего значения» и представлены в таблице 5.3.6.

Таблица 5.3.6




1,2,3

4,5,6

1,2,3

0

10,521875

4,5,6




0



Таким образом процесс кластерного анализа закончен. Выделено два

кластера. Расстояние между выделенными кластерами равно 10,52. Дендрограмма результатов кластерного анализа представлена на рис. 5.3.2.

Расстояние


10,52
10


8



6



4
2


1 2 3 4 5 6

Номера объектов

Рис. 5.3.2

Дендрограмма, представленная на рис 5.3.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.3 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.3.7) и символов Кронекера (таблица 5.3.8).

Таблица 5.3.7




1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2




0

3,16

8,94

10,77

12,53

3







0

7,07

9,06

10,44

4










0

2,00

3,61

5













0

2,24

6
















0