Файл: Контрольная работа по теме Базы данных в Excel 72 IV. Макросы в ms excel 78 Макросы для автоматизации работ 78.doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 08.11.2023

Просмотров: 595

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


Для имеющихся 14 объектов необходимо провести двумерную кластеризацию по двум первым показателям (Численность населения (тыс. чел.) и Средний доход на душу населения (руб/мес)). Эти показатели отражаются на имеющейся на этом же листе точечной диаграмме.

Для получения цепочки расстояний достаточно щелкнуть по кнопке «Расчет». В результате будут получены следующие результаты.

Таблица 7.5








E

F

G

H



















10




N

Расстояния

Номер1

Номер2

11




1

1,580785941

1

4

12




2

4,172284936

4

13

13




3

5,684705731

4

14

14




4

10,00815363

12

13

15




5

13,21538863

10

14

16




6

9,05471484

6

10

17




7

14,89015946

9

10

18




8

7,960007134

8

9

19




9

16,191226

3

12

20




10

18,44375842

3

7

21




11

39,5504765

2

3

22




12

11,1579027

2

11

23




13

8,939773259

5

11



Для 14 объектов получена цепочка, состоящая из 13 расстояний.
Процедура выделения кластеров производится следующим образом:

– просмотр начинается с первого расстояния. Оно сравнивается со вторым и третьим расстояниями. Все они пока одного порядка. Но четвертое расстояние подозрительно велико по сравнению с первыми тремя.

– для объективного принятия решения о «подозрительности» четвертого расстояния используется технология выявления промахов в ряду наблюдений (см. работу «Случайные величины»).

При этом для расстояний 1 – 4 вычисляются среднее и дисперсия и на их основе V-критерий.

Для этого:

  • в ячейку B24 вводится формула =СРЗНАЧ(F11:F14);

  • в ячейку B25 вводится формула =ДИСПРА(F11:F14);

  • в ячейку B26 вводится формула =ABS(B24-F14)/(3/4*B25)^(1/2).


В результате получено следующее:





A

B

24

Среднее

5,36148256

25

Дисперсия

9,350970798

26

V-критерий

1,754619489


Далее необходимо сравнить вычисленный критерий с табличным. При уровне значимости, равном 0,05, для четырех измерений этот критерий равен 1,69. Таким образом, вычисленное значение критерия больше табличного. Поэтому делается вывод о том, что проверяемое значение (10,00815363), действительно является промахом, т.е. резко отличается от остальных значений.
В табл. 7.5 эти строки выделены.

Применительно к рассматриваемой теме это означает, что данное расстояние (между 12 и 13 объектами) действительно является границей между кластерами.

В результате:

к первому кластеру можно отнести объекты входящий в перечень до этого расстояния – объекты 1, 4, 13 и 14.

Аналогично должны быть рассмотрены оставшиеся расстояния.

Для этого:

– просмотр начинается с 5 расстояния. Очевидно, что расстояния 5 – 10 одного порядка. А расстояние 11 «подозрительно» большое.



Для его проверки выполним аналогичные вычисления:

  • в ячейку C24 вводится формула =СРЗНАЧ(F15:F21);

  • в ячейку C25 вводится формула =ДИСПРА(F15:F21);

  • в ячейку C26 вводится формула =ABS(C24-F21)/(6/7*C25)^(1/2).

Результат вычислений:





A

B

C

24

Среднее

5,36148256

17,043676

25

Дисперсия

9,350970798

96,410418

26

V-критерий

1,754619489

2,4758548


Вычисленное значение V-критерия также больше табличного (V=2,09 для семи измерений и уровня значимости, равного 0,05. Поэтому делаем вывод о том, что расстояние 11 является границей между кластерами и ко второму кластеру следует отнести объекты 12, 10, 6, 9, 8, 3 и 7.

Для оставшихся объектов (2, 5 и 11) проверку можно не производить и их можно отнести к третьему кластеру.

На рис. 7.5 приведены визуализированные результаты кластеризации (исходная диаграмма построена в Excel, а кластеры обведены вручную в Paint).


Рис.7.5. Визуализация результатов кластеризации
7.4.5. Задания

Для указанных на Лист1 (файл Кластерный анализ.xls) объектов произвести кластеризацию по следующим показателям:


Вариант

(по журналу группы)

Комбинация

показателей

1

1, 3

2

1, 4

3

1, 5

4

1, 6

5

2, 3

6

2, 4

7

2, 5

8

2, 6

9

3, 4

10

3, 5

11

3, 6

12

4, 5

13

4, 6

14

5, 6



Значения показателей взять с Лист3 указанного файла или из таблицы 5.2 Приложения 5.

7.5. Анализ временных рядов

7.5.1. Общие сведения

Очень часто данные об экономических объектах представлены в виде последовательностей значений свойств объектов в различные моменты времени. Временным рядом  называется набор значений какого-либо показателя за несколько последовательных периодов времени.

Основная задача обработки временных рядов заключается в выявлении особенностей ряда с целью возможного прогноза свойств объекта в последующие моменты времени.

Анализ поведения экономических объектов во времени показывает, что они обладают рядом общих закономерностей.

  1. В поведении объекта может присутствовать регулярная составляющая. Она обычно отражает общую тенденцию развития объекта во времени. Например, спрос на нефть имеет устойчивую тенденцию к возрастанию – рис.7.6.
    Рис. 1


Представленная на рис.7.6 регулярная составляющая представляет собой прямую линию. Но не менее часто встречаются и другие ее виды – рис.7.7.




  1. На регулярную составляющую, как правило, накладываются периодические колебания свойств. Эти колебания могут быть связаны с влиянием времени года на свойства объекта – так называемые сезонные колебания. Например, потребление нефти в зимнее время меньше, чем в летнее. В результате этого, вместо рис.7.6. будет иметь место рис.7.8.



Рис. 7.8. Пример сезонной составляющей


  1. К сожалению, реальные данные практически никогда не выстраиваются в идеально гладкие кривые. Чаще всего имеют вид, представленный на рис.7.9.





Рис. 7.9. Пример наложения случайных возмущений

на сезонную составляющую
Вызвано это тем, что на объект влияет слишком большое количество других факторов, часто действующих в противоположном направлении. Эти факторы не столь существенны, как указанные первые два, но их, как правило, во-первых, очень много и, во-вторых, практически невозможно учесть. Поэтому вклад этих факторов рассматривается как случайная составляющая.