Файл: Гусельников дмитрий владимирович повышение экономического потенциала строительного предприятия.pdf
Добавлен: 12.01.2024
Просмотров: 419
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
2.2 Кластерный анализ как способ для наиболее эффективного
управления экономическим потенциалом
При разработке теоретической модели определения экономического потенциала строительного предприятия возникает важнейшая эвристическая задача – выработать приемлемую методику, с помощью которой можно было бы адекватно описать процесс его формирования. Данная задача осложняется тем, что понятийный аппарат данной категории многослойный и является
76 неоднородным по своей структуре, а объем и содержание этих понятий как отражение различных аспектов процесса его формирования еще окончательно не определился.
В современных мировоззренческих концепциях окружающие нас предметы и явления представляются как целостные и неделимые, однако в зависимости от целей исследований отдельные системы можно разделить на составные элементы, т.е. структурировать. Это структурирование заключается в представлении системы в виде совокупности взаимодействующих, иерархически расположенных подсистем. При этом эта иерархическая расположенность может быть либо горизонтально упорядочена, так и вертикально.
При горизонтальной структуре, подсистемы оказывают друг на друга влияние за счет наличия между ними определенных связей, при вертикальной же структуре элементы системы располагаются по уровню сложности принятия решений или по степени важности данных элементов системы.
Таким образом, если рассматривать экономический потенциал строительного предприятия как систему, состоящую из горизонтально структурированных субпотенциалов соединенных между собой определенными взаимосвязями, уместно предполагать, что ему присущ
«эффект эмерджентности», т.е. получение при объединении его элементов целого работоспособного элемента, свойства которого выше семы объединенных субпотенциалов. Данный эффект является количественным или качественным выражением синергии, во главу закона которой положен принцип эмерджентности сложных систем: совместное действие нескольких факторов всегда или почти всегда отличается от суммы раздельных эффектов.
Данное предположение основано на том, что для проявления эффекта синергии необходимыми условиями выступают: множественность элементов и отношений в системе, наличие синтезирующих динамик (т.е. наличие такого изменения в системе, когда интегрирующийся элемент, образует при этом новые взаимодействия), и разнородность элементов системы [14, 25]. Наличие
77 данных условий в совокупности экономического потенциала строительного предприятия создаѐт синергетический эффект.
В соответствии с этим экономический потенциал можно трактовать уже не как систему, состоящую из некоего числа и состава организованных элементов, а как уже систему, состоящую из числа, состава и качеств взаимосвязей этих элементов.
В абстрактном виде закон синергии можно представить следующим образом [53]:
(4) где
– потенциал системы А;
– i-й элемент системы А;
– потенциал i-го элемента.
Синергетический эффект, таким образом, зависит как от числа и качественного состава системообразующих элементов экономического потенциала, так и от способа их соединения, гармонии и тесноты связей между ними, или организационной целостности. Проследить процесс формирования данных взаимосвязей позволяет такая многомерная процедура как кластерный анализ.
Кластерный анализ – методика исследования данных при помощи разбиения заданной выборки объектов на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из «схожих» объектов, а объекты разных кластеров существенно отличались [14].
Кластер - это объединение элементов, близких друг другу в каком-то смысле. Кластеры являются чрезвычайно благоприятной средой для развития синергетического эффекта, поскольку синергия обычно возникает в системах с достаточной степенью интеграции отдельных элементов. Основой синергетического эффекта в подобных случаях является оптимальное
78 сочетание элементов, входящих в систему, эффективность их взаимодействия, а также качество элементов системы [18].
Актуальность и необходимость нахождения данных связей при помощи кластерного анализа обусловлена тем, что главным условием эффективной деятельности предприятий, и предприятий стройиндустрии в частности, является строгая координация действий всех подразделений и их элементов.
Реальное достижение синергизма есть не только как важная составляющая для эффективного управления экономическим потенциалом, но, а так же позволяет предприятию создать для себя дополнительную ценность.
Стоит отметить, что чем крупнее компания, тем больше она имеет возможностей по применению синергии и тем больше у нее вариантов по увеличению экономической эффективности деятельности [100].
В нашей работе мы не ставим цели разработать какие-либо положения по междисциплинарной науке – синергетики, но при исследовании проблем управления экономическим потенциалом строительного предприятия как сложной многосоставной системы воспользуемся понятийным аппаратом синергетики и ее разработанным инструментарием.
Существует множество определений синергетики, сделанных в разное время разными учеными [25, 53, 55 и др.]. Обобщены они следующим образом: «синергетика – это наука о сложных системах, взаимодействующих с внешней средой, в которых наблюдается коллективное многочастичное действие разнородных элементов, приводящее к необратимому, нелинейному, неравновесному поведению системы, развитию системы через каскад относительно устойчивых состояний» [55].
Идея нелинейности протекания организационных явлений всѐ чаще встречается в организационных исследованиях. В отличие от пассивных линейных систем, способных функционировать главным образом под воздействием внешних сил, нелинейные системы внутренне активны.
Деятельность предприятий под влиянием этих систем выражена в разнообразных по качеству, уровню развития и количеству показателях и
79 процессах. Организация этих процессов на предприятиях предполагает постоянную смену их состояний, перестраивание, постоянное обновление, что в силу необратимости и неравномерности этих процессов позволяет предприятиям оставаться функционирующими и быть конкурентоспособными.
Таким образом, постоянные перемены стали неотъемлемой частью деятельности предприятий. Ни один процесс на предприятии не обходится без больших или малых изменений. Более того, неопределенность внешней среды заставляет проводить эти изменения регулярно: необходимо осуществлять мониторинг, улавливать сигналы и в соответствии с ними менять стратегический курс, планы, структуру, подходы к решению проблем. Любое предприятие находится в процессе непрерывных изменений, так как в противном случае их способность к выживанию в динамичной обстановке ставится под угрозу.
Изменения на предприятиях в одних случаях происходят целенаправленно на базе систематически разрабатываемых концепций запланированных усовершенствований, в других – носят скорее неформальный и адаптивный характер, когда предприятие (или его части) оперативно приспосабливается к внешней среде путем модификации своего поведения (как реакция на текущие события) [7, 15].
Так же одной из основных характеристик синергетики, которая сможет в значительной мере объяснить возникновение синергических эффектов при образовании совокупного экономического потенциала можно отнести аттрактивность.
Нелинейные системы часто описывают системой дифференциальных уравнений. Представление решения этих уравнений как движения некоторой точки в пространстве с размерностью, равной числу переменных, называют фазовыми траекториями системы. Поведение фазовой траектории в смысле устойчивости показывает, что существует несколько основных его типов, когда все решения системы в конечном счете сосредотачиваются на некотором
80 подмножестве. Такое подмножество называется аттрактором [43]. Либо другими словами [53] – это некоторая совокупность условий, при которых выбор путей движения или эволюции разных систем происходит по сходящимся траекториям, и, в конечном счете, как бы притягивается к одной точке.
Данная точка будет являться неким центром притяжения, вокруг которой можно выделить границу, в пределах которой и будет лежать кластер.
В общем смысле в ходе нашего исследования кластер рассматривается как нелинейная динамическая система, выступающая в форме кооперативного взаимодействия входящих в него элементов.
При этом достаточно малое изменение начальных условий, находящихся вблизи указанной границы, может привести к качественно различному поведению всей нелинейной системы. Это будет означать, что, прилагая к системе достаточно малые воздействия, согласованные с ее внутренними свойствами, можно обеспечить качественно новое поведение нелинейной системы вдали от ее положения равновесия [53]. Такое свойство нелинейных систем, открывает новые возможности в решении задач управления экономическим потенциалом при использовании кластерного анализа.
2.3 Алгоритм использования кластерного анализа в методике для
оценки уровня экономического потенциала строительного предприятия
Кластерный анализ растущая дисциплина, которая представляет собой уникальный метод по проведению классификации совокупностей объектов объединенных определенным признаком. К такой совокупности как раз и относится экономический потенциал.
Сама по себе проблема классификации является чрезвычайно богатой и разветвленной сферой
81 деятельности и в последние годы к области классификации наблюдений, а в особенности к кластерному анализу был проявлен огромный интерес.
Первоначальное описание и определение термина известного сейчас как «кластерный анализ» было сделано Р.Трионом в 1939 г. который употребил понятие «cluster» (кластер), что в переводе с английского языка означает «сгусток», «гроздь (винограда)», «скопление (звезд)» и т. п. [111].
Впоследствии возник ряд терминов, которые в настоящее время принято считать синонимами термина «кластерный анализ»: автоматическая классификация, ботриология, таксономия, обоснование без обучения и пр.
Центральным понятием в кластерном анализе является понятие
«кластера». Под «кластером» обычно понимается часть данных (в типичном случае – подмножество объектов или подмножество переменных, или подмножество объектов, характеризуемых подмножеством переменных), которая выделяется из остальной части наличием некоторой однородности ее элементов. В простейшем случае речь идет о похожести элементов, в идеальном случае – о совпадающих значениях основных переменных или иного рода близости, выражаемой геометрической близостью соответствующих объектов [62, 63].
В отличие от других методов в кластерном анализе при группировке используются все признаки объектов, и отсутствует так называемая обучающая выборка или распознавание образов без «учителя», т.е. выборка, при которой требуется оптимизация показателей. Это отличие является достаточно существенным и во многом определяет уникальность методологии применения кластерного анализа для решения задач классификации показателей экономического потенциала.
Главное назначение кластерного анализа – разбиение множества исследуемых объектов и признаков на однородные в соответствующем понимании группы или кластеры. Это означает, что решается задача классификации данных и выявления соответствующей структуры в ней.
Методы кластерного анализа можно применять в самых различных
82 случаях, даже в тех случаях, когда речь идет о простой группировке, в которой все сводится к образованию групп по количественному сходству.
Под однородностью или сходством понимается близость объектов в многомерном пространстве признаков. Тогда задача сводится к выделению в этом пространстве естественных скоплений объектов, которые и считаются однородными группами [41].
В общем случае понятие однородности объектов задается введением
«метрики» — правила вычисления расстояний между любой парой объектов исследуемого множества. Проблема вычисления расстояний неизбежно возникает при любых трактовках кластеров и различных методах классификации и в зависимости от способа решения этой проблемы методы кластерного анализа можно подразделить на два вида: иерархические
(агломеративные и дивизимные методы) и неиерархические (структурные методы) [16, 41, 59].
Неиерархические методы хоть и удобны для обработки больших статистических совокупностей, однако при их использовании процесс классификации необходимо начинать с задания некоторых начальных условий (количество образуемых кластеров, порог завершения процесса классификации и т.д.), что привносит в процесс анализа долю субъективизма.
Иерархические же методы, не требуют предварительных предположений относительно числа кластеров, а их процедуры позволяют на разных этапах проследить процесс выделения образующихся группировок и иллюстрируют соподчинѐнность кластеров.
Следует подчеркнуть ещѐ одно различие иерархических и неиерархических алгоритмов: первые всегда построят дендрограмму, а задача естественного расслоения исходных данных на четко выраженные кластеры, решаемая вторыми, может и не иметь решения [41].
Смысл иерархических агломеративных методов состоит в последовательном объединении групп элементов, сначала самых близких, а
83 затем все более отдаленных друг от друга. В результате между собой связываются всѐ большее и большее число объектов и образуются группы схожих кластеров. Окончательно на последнем шаге все объекты объединяются вместе. Принцип работы дивизимных процедур обратный, и заключается в разделении сначала самых далеких групп элементов, а потом все более близких друг от друга. Большинство этих алгоритмов исходит из матрицы расстояний (сходства). На рисунке 9 изображен принцип работы иерархических методов кластерного анализа.
Рисунок 9 – Дендрограмма иерархических методов кластерного анализа [41]
На первом шаге, когда каждый объект представляет собой отдельный кластер, для того чтобы найти связь между ними необходимо найти расстояние между этими объектами. Эти расстояния могут определяться в одномерном или многомерном пространстве.
Для вычисления количественной оценки расстояния (удалѐнности) между объектами, как уже говорилось выше, вводится метрика. Выбор метрики играет определяющую роль при решении задач кластерного
Шаг0
Шаг1
Шаг2
Шаг3
Шаг4 a b c d e ab de cde abcde
Шаг0
Шаг1
Шаг2
Шаг3
Шаг4
Агломеративные методы
Дивизимные методы
84 анализа и является узловым моментом исследования, от которого в основном зависит окончательный вариант разбиения объектов на классы при данном алгоритме разбиения. Использование неадекватной функции расстояния может привести либо к плохому качеству разбиения, либо к разбиению, лишѐнному содержательного смысла с точки зрения исследователя даже в том случае, когда объекты потенциально могут быть сгруппированы [41].
Эти расстояния могут определяться в одномерном или многомерном пространстве. Наиболее прямой путь вычисления расстояний между объектами в многомерном пространстве состоит в вычислении евклидовых расстояний. Если пространство двух- или трѐхмерное, то эта мера является реальным геометрическим расстоянием между объектами в пространстве.
Однако алгоритм объединения не "заботится" о том, являются ли "предоставленные" для этого расстояния настоящими или некоторыми другими производными мерами расстояния [16]. Следовательно при исследовании объектов экономического потенциала строительно предприятия очень важной задачей становится выбор правильного метода определения расстояния между объектами учитывающий специфичность применения.
Рассмотрим основные способы определения близости между объектами. В таблице 8 приведены некоторые часто употребляемые методы определения расстояния и меры близости, используемые для признаков, измеренных в разных шкалах. Данные таблицы 8 не ставят своей целью детальный обзор всех алгоритмов и не претендуют на широту обзора, только отметим, что 27 мер сходства приведены в [28], примерно около 50
— в [20, 29 57], традиционные меры и расстояния для количественных шкал описаны в [3, 42, 62, 63 и др.]. Попытаемся охарактеризовать специфику некоторых приведенных показателей. Наше описание методов весьма кратко и за деталями мы будем отсылать к источникам.
управления экономическим потенциалом
При разработке теоретической модели определения экономического потенциала строительного предприятия возникает важнейшая эвристическая задача – выработать приемлемую методику, с помощью которой можно было бы адекватно описать процесс его формирования. Данная задача осложняется тем, что понятийный аппарат данной категории многослойный и является
76 неоднородным по своей структуре, а объем и содержание этих понятий как отражение различных аспектов процесса его формирования еще окончательно не определился.
В современных мировоззренческих концепциях окружающие нас предметы и явления представляются как целостные и неделимые, однако в зависимости от целей исследований отдельные системы можно разделить на составные элементы, т.е. структурировать. Это структурирование заключается в представлении системы в виде совокупности взаимодействующих, иерархически расположенных подсистем. При этом эта иерархическая расположенность может быть либо горизонтально упорядочена, так и вертикально.
При горизонтальной структуре, подсистемы оказывают друг на друга влияние за счет наличия между ними определенных связей, при вертикальной же структуре элементы системы располагаются по уровню сложности принятия решений или по степени важности данных элементов системы.
Таким образом, если рассматривать экономический потенциал строительного предприятия как систему, состоящую из горизонтально структурированных субпотенциалов соединенных между собой определенными взаимосвязями, уместно предполагать, что ему присущ
«эффект эмерджентности», т.е. получение при объединении его элементов целого работоспособного элемента, свойства которого выше семы объединенных субпотенциалов. Данный эффект является количественным или качественным выражением синергии, во главу закона которой положен принцип эмерджентности сложных систем: совместное действие нескольких факторов всегда или почти всегда отличается от суммы раздельных эффектов.
Данное предположение основано на том, что для проявления эффекта синергии необходимыми условиями выступают: множественность элементов и отношений в системе, наличие синтезирующих динамик (т.е. наличие такого изменения в системе, когда интегрирующийся элемент, образует при этом новые взаимодействия), и разнородность элементов системы [14, 25]. Наличие
77 данных условий в совокупности экономического потенциала строительного предприятия создаѐт синергетический эффект.
В соответствии с этим экономический потенциал можно трактовать уже не как систему, состоящую из некоего числа и состава организованных элементов, а как уже систему, состоящую из числа, состава и качеств взаимосвязей этих элементов.
В абстрактном виде закон синергии можно представить следующим образом [53]:
(4) где
– потенциал системы А;
– i-й элемент системы А;
– потенциал i-го элемента.
Синергетический эффект, таким образом, зависит как от числа и качественного состава системообразующих элементов экономического потенциала, так и от способа их соединения, гармонии и тесноты связей между ними, или организационной целостности. Проследить процесс формирования данных взаимосвязей позволяет такая многомерная процедура как кластерный анализ.
Кластерный анализ – методика исследования данных при помощи разбиения заданной выборки объектов на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из «схожих» объектов, а объекты разных кластеров существенно отличались [14].
Кластер - это объединение элементов, близких друг другу в каком-то смысле. Кластеры являются чрезвычайно благоприятной средой для развития синергетического эффекта, поскольку синергия обычно возникает в системах с достаточной степенью интеграции отдельных элементов. Основой синергетического эффекта в подобных случаях является оптимальное
78 сочетание элементов, входящих в систему, эффективность их взаимодействия, а также качество элементов системы [18].
Актуальность и необходимость нахождения данных связей при помощи кластерного анализа обусловлена тем, что главным условием эффективной деятельности предприятий, и предприятий стройиндустрии в частности, является строгая координация действий всех подразделений и их элементов.
Реальное достижение синергизма есть не только как важная составляющая для эффективного управления экономическим потенциалом, но, а так же позволяет предприятию создать для себя дополнительную ценность.
Стоит отметить, что чем крупнее компания, тем больше она имеет возможностей по применению синергии и тем больше у нее вариантов по увеличению экономической эффективности деятельности [100].
В нашей работе мы не ставим цели разработать какие-либо положения по междисциплинарной науке – синергетики, но при исследовании проблем управления экономическим потенциалом строительного предприятия как сложной многосоставной системы воспользуемся понятийным аппаратом синергетики и ее разработанным инструментарием.
Существует множество определений синергетики, сделанных в разное время разными учеными [25, 53, 55 и др.]. Обобщены они следующим образом: «синергетика – это наука о сложных системах, взаимодействующих с внешней средой, в которых наблюдается коллективное многочастичное действие разнородных элементов, приводящее к необратимому, нелинейному, неравновесному поведению системы, развитию системы через каскад относительно устойчивых состояний» [55].
Идея нелинейности протекания организационных явлений всѐ чаще встречается в организационных исследованиях. В отличие от пассивных линейных систем, способных функционировать главным образом под воздействием внешних сил, нелинейные системы внутренне активны.
Деятельность предприятий под влиянием этих систем выражена в разнообразных по качеству, уровню развития и количеству показателях и
79 процессах. Организация этих процессов на предприятиях предполагает постоянную смену их состояний, перестраивание, постоянное обновление, что в силу необратимости и неравномерности этих процессов позволяет предприятиям оставаться функционирующими и быть конкурентоспособными.
Таким образом, постоянные перемены стали неотъемлемой частью деятельности предприятий. Ни один процесс на предприятии не обходится без больших или малых изменений. Более того, неопределенность внешней среды заставляет проводить эти изменения регулярно: необходимо осуществлять мониторинг, улавливать сигналы и в соответствии с ними менять стратегический курс, планы, структуру, подходы к решению проблем. Любое предприятие находится в процессе непрерывных изменений, так как в противном случае их способность к выживанию в динамичной обстановке ставится под угрозу.
Изменения на предприятиях в одних случаях происходят целенаправленно на базе систематически разрабатываемых концепций запланированных усовершенствований, в других – носят скорее неформальный и адаптивный характер, когда предприятие (или его части) оперативно приспосабливается к внешней среде путем модификации своего поведения (как реакция на текущие события) [7, 15].
Так же одной из основных характеристик синергетики, которая сможет в значительной мере объяснить возникновение синергических эффектов при образовании совокупного экономического потенциала можно отнести аттрактивность.
Нелинейные системы часто описывают системой дифференциальных уравнений. Представление решения этих уравнений как движения некоторой точки в пространстве с размерностью, равной числу переменных, называют фазовыми траекториями системы. Поведение фазовой траектории в смысле устойчивости показывает, что существует несколько основных его типов, когда все решения системы в конечном счете сосредотачиваются на некотором
80 подмножестве. Такое подмножество называется аттрактором [43]. Либо другими словами [53] – это некоторая совокупность условий, при которых выбор путей движения или эволюции разных систем происходит по сходящимся траекториям, и, в конечном счете, как бы притягивается к одной точке.
Данная точка будет являться неким центром притяжения, вокруг которой можно выделить границу, в пределах которой и будет лежать кластер.
В общем смысле в ходе нашего исследования кластер рассматривается как нелинейная динамическая система, выступающая в форме кооперативного взаимодействия входящих в него элементов.
При этом достаточно малое изменение начальных условий, находящихся вблизи указанной границы, может привести к качественно различному поведению всей нелинейной системы. Это будет означать, что, прилагая к системе достаточно малые воздействия, согласованные с ее внутренними свойствами, можно обеспечить качественно новое поведение нелинейной системы вдали от ее положения равновесия [53]. Такое свойство нелинейных систем, открывает новые возможности в решении задач управления экономическим потенциалом при использовании кластерного анализа.
2.3 Алгоритм использования кластерного анализа в методике для
оценки уровня экономического потенциала строительного предприятия
Кластерный анализ растущая дисциплина, которая представляет собой уникальный метод по проведению классификации совокупностей объектов объединенных определенным признаком. К такой совокупности как раз и относится экономический потенциал.
Сама по себе проблема классификации является чрезвычайно богатой и разветвленной сферой
81 деятельности и в последние годы к области классификации наблюдений, а в особенности к кластерному анализу был проявлен огромный интерес.
Первоначальное описание и определение термина известного сейчас как «кластерный анализ» было сделано Р.Трионом в 1939 г. который употребил понятие «cluster» (кластер), что в переводе с английского языка означает «сгусток», «гроздь (винограда)», «скопление (звезд)» и т. п. [111].
Впоследствии возник ряд терминов, которые в настоящее время принято считать синонимами термина «кластерный анализ»: автоматическая классификация, ботриология, таксономия, обоснование без обучения и пр.
Центральным понятием в кластерном анализе является понятие
«кластера». Под «кластером» обычно понимается часть данных (в типичном случае – подмножество объектов или подмножество переменных, или подмножество объектов, характеризуемых подмножеством переменных), которая выделяется из остальной части наличием некоторой однородности ее элементов. В простейшем случае речь идет о похожести элементов, в идеальном случае – о совпадающих значениях основных переменных или иного рода близости, выражаемой геометрической близостью соответствующих объектов [62, 63].
В отличие от других методов в кластерном анализе при группировке используются все признаки объектов, и отсутствует так называемая обучающая выборка или распознавание образов без «учителя», т.е. выборка, при которой требуется оптимизация показателей. Это отличие является достаточно существенным и во многом определяет уникальность методологии применения кластерного анализа для решения задач классификации показателей экономического потенциала.
Главное назначение кластерного анализа – разбиение множества исследуемых объектов и признаков на однородные в соответствующем понимании группы или кластеры. Это означает, что решается задача классификации данных и выявления соответствующей структуры в ней.
Методы кластерного анализа можно применять в самых различных
82 случаях, даже в тех случаях, когда речь идет о простой группировке, в которой все сводится к образованию групп по количественному сходству.
Под однородностью или сходством понимается близость объектов в многомерном пространстве признаков. Тогда задача сводится к выделению в этом пространстве естественных скоплений объектов, которые и считаются однородными группами [41].
В общем случае понятие однородности объектов задается введением
«метрики» — правила вычисления расстояний между любой парой объектов исследуемого множества. Проблема вычисления расстояний неизбежно возникает при любых трактовках кластеров и различных методах классификации и в зависимости от способа решения этой проблемы методы кластерного анализа можно подразделить на два вида: иерархические
(агломеративные и дивизимные методы) и неиерархические (структурные методы) [16, 41, 59].
Неиерархические методы хоть и удобны для обработки больших статистических совокупностей, однако при их использовании процесс классификации необходимо начинать с задания некоторых начальных условий (количество образуемых кластеров, порог завершения процесса классификации и т.д.), что привносит в процесс анализа долю субъективизма.
Иерархические же методы, не требуют предварительных предположений относительно числа кластеров, а их процедуры позволяют на разных этапах проследить процесс выделения образующихся группировок и иллюстрируют соподчинѐнность кластеров.
Следует подчеркнуть ещѐ одно различие иерархических и неиерархических алгоритмов: первые всегда построят дендрограмму, а задача естественного расслоения исходных данных на четко выраженные кластеры, решаемая вторыми, может и не иметь решения [41].
Смысл иерархических агломеративных методов состоит в последовательном объединении групп элементов, сначала самых близких, а
83 затем все более отдаленных друг от друга. В результате между собой связываются всѐ большее и большее число объектов и образуются группы схожих кластеров. Окончательно на последнем шаге все объекты объединяются вместе. Принцип работы дивизимных процедур обратный, и заключается в разделении сначала самых далеких групп элементов, а потом все более близких друг от друга. Большинство этих алгоритмов исходит из матрицы расстояний (сходства). На рисунке 9 изображен принцип работы иерархических методов кластерного анализа.
Рисунок 9 – Дендрограмма иерархических методов кластерного анализа [41]
На первом шаге, когда каждый объект представляет собой отдельный кластер, для того чтобы найти связь между ними необходимо найти расстояние между этими объектами. Эти расстояния могут определяться в одномерном или многомерном пространстве.
Для вычисления количественной оценки расстояния (удалѐнности) между объектами, как уже говорилось выше, вводится метрика. Выбор метрики играет определяющую роль при решении задач кластерного
Шаг0
Шаг1
Шаг2
Шаг3
Шаг4 a b c d e ab de cde abcde
Шаг0
Шаг1
Шаг2
Шаг3
Шаг4
Агломеративные методы
Дивизимные методы
84 анализа и является узловым моментом исследования, от которого в основном зависит окончательный вариант разбиения объектов на классы при данном алгоритме разбиения. Использование неадекватной функции расстояния может привести либо к плохому качеству разбиения, либо к разбиению, лишѐнному содержательного смысла с точки зрения исследователя даже в том случае, когда объекты потенциально могут быть сгруппированы [41].
Эти расстояния могут определяться в одномерном или многомерном пространстве. Наиболее прямой путь вычисления расстояний между объектами в многомерном пространстве состоит в вычислении евклидовых расстояний. Если пространство двух- или трѐхмерное, то эта мера является реальным геометрическим расстоянием между объектами в пространстве.
Однако алгоритм объединения не "заботится" о том, являются ли "предоставленные" для этого расстояния настоящими или некоторыми другими производными мерами расстояния [16]. Следовательно при исследовании объектов экономического потенциала строительно предприятия очень важной задачей становится выбор правильного метода определения расстояния между объектами учитывающий специфичность применения.
Рассмотрим основные способы определения близости между объектами. В таблице 8 приведены некоторые часто употребляемые методы определения расстояния и меры близости, используемые для признаков, измеренных в разных шкалах. Данные таблицы 8 не ставят своей целью детальный обзор всех алгоритмов и не претендуют на широту обзора, только отметим, что 27 мер сходства приведены в [28], примерно около 50
— в [20, 29 57], традиционные меры и расстояния для количественных шкал описаны в [3, 42, 62, 63 и др.]. Попытаемся охарактеризовать специфику некоторых приведенных показателей. Наше описание методов весьма кратко и за деталями мы будем отсылать к источникам.