Файл: Гусельников дмитрий владимирович повышение экономического потенциала строительного предприятия.pdf
Добавлен: 12.01.2024
Просмотров: 414
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
85
Таблица 8 – Основные способы определения близости между кластерами
Название
Формула расчета
Расстояние Евклида
Квадрат Евклидова расстояния
Расстояние Чебышева
Манхэттенское расстояние или расстояние городских кварталов
Обобщенное степенное расстояние
Минковского
Расстояние Махаланобиса
Коэффициент Рао
Коэффициент Хемминга
Коэффициент Роджерса-Танимото
Коэффициент Жаккара
Мера близости Журавлева
Мера близости Воронина
Мера близости Миркина значение l-го признака у i-го объекта,
;
; вектор-столбец значений всех признаков на i-м объекте; матрица, обратная ковариационной; общее число совпадающих значений свойств (нулевых и единичных, где 1 – наличие свойства, 0 – отсутствие); число совпадающих единичных свойств; число единичных значений свойств;
Расстояние Евклида это, пожалуй, наиболее самый общий тип расстояния и является самой популярной метрикой в кластерном анализе.
Оно попросту является геометрическим расстоянием в многомерном пространстве. Главным преимуществом этой метрики является то, что
86
Евклидово расстояние (и его квадрат) вычисляется по исходным, а не по стандартизованным данным. Это обычный способ его вычисления, который имеет определенные преимущества. Например, расстояние между двумя объектами не изменяется при введении в анализ нового объекта, который может оказаться выбросом (результат измерения, выделяющийся из общей выборки, который необходимо исключить). Расстояние Евклида рекомендуется применять в случаях, если признаки достаточно однородны по своему физическому смыслу, причѐм, установлено, что все они одинаково важны с точки зрения решения вопроса об отнесении объекта к тому или иному классу.
В зависимости от целей исследования для придания больших весов более отдаленным друг от друга объектам можно использовать квадрат
Евклидова расстояния, для этого просто необходимо возвести в квадрат стандартное расстояние Евклида.
Расстояние Чебышева [16] эта метрика подойдет только в том случае, когда необходимо определить классы двух объектов как "различные", при этом имеется предположение, что существует какой-то признак, по которому они отличаются.
При использовании манхэттенского расстояния (или расстояние городских кварталов) рассчитывается среднее разностей по координатам
[16]. В большинстве случаев эта метрика расстояния приводит к результатам, подобным при расчете, как и для расстояния Евклида.
Однако, для этой меры влияние отдельных выбросов меньше, чем при использовании расстояния Евклида, так как здесь координаты не возводятся в квадрат. Чаще всего эта метрика предполагает дихотомическое деление объектов [41], т.е. чем больше групп схожих кластеров будет образовываться в процессе анализа, тем труднее нам будет установить признак по какому принципу тот или иной объект попал именно в этот кластер.
87
Обобщенное степенное расстояние Минковского применяют, когда желают прогрессивно увеличить или уменьшить вес, относящийся к размерности, для которой соответствующие объекты сильно отличаются.
[16, 41] Выбор конкретного значения степенного показателя в данном случае производится самим исследователем. И таким образом расстояние
Минковского фактически представляет собой «универсальную модель», включающую в себя другие метрики. Так если p – параметр, ответственный за постепенное взвешивание разностей по отдельным параметрам, и r – параметр, ответственный за прогрессивное взвешивание больших расстояний между векторами будут равны 1, то расстояние
Минковского будет соответствовать Манхэттенскому расстоянию, в случае при p и r параметрам равным 2 оно будет соответствовать расстоянию
Евклида.
Однако встречаются методы вычисления расстояния между объектами, принципиально отличающиеся от выше рассмотренных метрик.
Одним из таких является так называемое расстояние Махаланобиса [29].
Эта метрика позволяет учесть корреляцию признаков с помощью матрицы дисперсий-ковариаций. Хотя следует отметить, что в случае, если все события класса независимы, то все коэффициенты ковариационной матрицы, кроме стоящих на диагонали, будут равны нулю. Таким образом, евклидово расстояние является частным случаем расстояния
Махаланобиса. Использование расстояния Махаланобиса ограничивается тем, что для того, чтобы корреляционная матрица была невырождена или отличной от нуля, необходимо, чтобы количество признаков было не меньше количества элементов класса, что для реальных задач далеко не всегда, выполнимо [106].
Выше описанные нами метрики являются наиболее удобными и применяются значительно чаще других в процессе кластерного анализа.
Конечно, помимо их еще существует довольно большое число способов определения расстояния между объектами, а поэтому нереально пытаться
88 дать исчерпывающее описание всей совокупности этих мер. Стоит только отметить, что из рассмотренных нами метрик довольно небольшое количество подверглось широкой проверке. В основном в их основе лежит результат определенных теоретических предпосылок процесса классификации, которые указывают на факт осуществления некоторого события или выполнения определѐнного критерия, т.е. их можно отнести к так называемым коэффициентам ассоциативности.
В нашей же ситуации когда мы проводим анализ при отсутствии априорной информации в условиях неопределѐнности и корреляционные характеристики классов заранее нам не известны и сами классы формируются и уточняются в процессе измерений в реальном времени, ничего не остается, как применить расстояние Евклида.
Метрика Евклида, используемая для определения расстояния между объектами, удовлетворяет всем аксиомам расстояния. Она не учитывает распределение точек в классе, а так же рассмотренные нами примеры показали, что искажения евклидова расстояния не очень сильно влияют на результаты иерархических алгоритмов[41].
Мы установили, что на первом шаге, при объединении объектов в отдельный кластер, расстояния между этими объектами определяются выбранной метрикой. Однако далее, когда связываются вместе несколько кластеров, появляется необходимость в определении расстояния уже между кластерами. Другими словами нам, необходимо выбрать правило объединения для двух кластеров.
Рассмотрим некоторые правила объединения объектов в кластер, реализованные в алгоритмах агломеративных иерархических методов.
Поскольку в этих методах на первом шаге каждый объект понимается как отдельный кластер, то будем говорить о правилах объединения кластеров, подразумевая, что эти правила распространяются и на условия включения объекта в кластер.
89
Здесь имеются различные возможности: например, можно связать два кластера вместе, когда любые два объекта в двух кластерах ближе друг к другу, чем соответствующее расстояние связи. Данный способ называется методом одиночной связи, при нем образуются кластеры сцепленные вместе только отдельными элементами, случайно оказавшиеся ближе остальных друг к другу. Другими словами, используется правило
«ближайшего соседа» для определения расстояния между кластерами.
Либо для связи кластеров использовать объекты, которые находятся дальше всех остальных пар объектов друг от друга. Этот метод называется методом полной связи или «дальнего соседа».
Недостатком этих методов является образование слишком больших
«продолговатых» кластеров - «цепочек». Эти методы обычно работают очень хорошо, когда объекты существенно различаются [41].
Существует также множество других методов объединения кластеров, и метод кластерного анализа предлагает широкий выбор таких методов [42, 69], в нашей работе мы предлагаем использовать метод Варда, в некоторых источниках он встречается под названием метода Уорда.
Этот метод отличается от всех других, поскольку он использует методы дисперсионного анализа для оценки расстояний между кластерами.
Метод минимизирует сумму квадратов для любых двух (гипотетических) кластеров, которые могут быть сформированы на каждом шаге. На каждом шаге объединяются такие два кластера, которые приводят к минимальному увеличению целевой функции, т.е. внутригрупповой суммы квадратов.
Таким образом, поля средних значений будут близки между собой и по структуре, поскольку будут иметь большие значения пространственной корреляции. Метод Варда приводит к образованию кластеров приблизительно равных размеров с минимальной внутриклассовой вариацией. В итоге все объекты оказываются объединенными в один кластер [69].
90
Рассмотрев множество методов кластерного анализа, в результате каждого из которых получаются несколько отличающиеся результаты, встает вопрос какой же метод лучше использовать для оценки экономического потенциала строительного предприятия. На наш взгляд, в процессе создания классификаций имеющихся показателей субпотенциалов и определения степени их влияния на совокупный экономический потенциал необходимо использовать такие методы, которые бы учитывали доступность имеющейся информации, имели практическую простоту вычисления, дали возможность результативно отслеживать изменения взаимосвязей показателей в динамике и не вносили бы субъективизм в расчеты.
Имеются некоторые рекомендации практического плана по выбору алгоритма кластеризации, полученные на основе экспериментального сравнения различных методов [40, 59,]. Рассмотрев их и учитывая специфику строительной отрасли на рисунке 10 представлен алгоритм оценки экономического потенциала строительного предприятия на основе кластерного анализа.
На первом этапе алгоритма производится анализ и отбор показателей, влияющих на экономический потенциал строительного предприятия. На втором этапе осуществляется построение матрицы, содержащей рассчитанные количественные значения показателей, отобранных на предыдущем этапе. С целью достижения объективности анализа данные матрицы нормализуются, т.е. приводятся в единую метрику.
На третьем этапе осуществляется кластеризация нормализованных значений показателей, влияющих на экономический потенциал строительного предприятия с использованием метода Варда и Евклидова расстояния. Применение данного метода кластеризации позволит проследить процесс выделения образующихся группировок и
91 проиллюстрируют соподчинѐнность и содержание кластеров, которые будут состоять из наиболее схожих по значениям факторов.
Рисунок 10 – Алгоритм оценки величины экономического потенциала строительного предприятия на основе кластерного анализа
Затем, для того, чтобы проверить полученный результат относительно числа кластеров, на четвертом этапе алгоритма производится кластеризация показателей методом k-средних. Данный метод позволит
3. Кластеризация показателей методом
Варда с использованием
Евклидова расстояния
4. Кластеризация показателей методом
k-средних предположения о количестве кластеров нет количество кластеров известно заранее
2. Построение матрицы, содержащей значения отобранных показателей, и их нормализация
1. Отбор показателей, характеризующих особенности деятельности предприятия и влияющих на экономический потенциал, и определение их нормативных
(желаемых) значений проверка гипотезы о количестве кластеров
5. Определение количества, состава и характера кластеров
6.Определение влияния субпотенциалов на экономический потенциал строительного предприятия
7. Использование результатов для принятия управленческих решений
92 осуществить проверку гипотезы о количестве и составе кластеров. Если же представление о числе кластеров известно заранее, то осуществить кластеризацию можно сразу методом k-средних.
На пятом этапе, чтобы оценить каждый кластер, рассчитывается разработанный выше интегральный показатель, который будет служить индикатором того, каким уровнем экономическо потенциала обладает данный кластер.
Для верификации полученных результатов, на шестом этапе определяется влияние на величину экономического потенциала каждого отдельного субпотенциала. Для этого полученные при расчете методом k- средних значения F-статистики (уровня значимости) для каждого показателя субпотенциалов экономического потенциала сравниваются между собой. Данные значения позволяют судить о том, какой фактор имеет наибольшую значимость при распределении объектов по кластерам.
В рамках седьмого этапа для принятия управленческих решений и поиска способов повышения уровня экономического потенциала предприятия, полученные данные обобщаются, и в зависимости от целей предприятия в стратегической перспективе выбирается та или иная модель поведения, реализация которой будет задавать развитие предприятия в искомом направлении.
На основе разработанной методики целесообразно еѐ применение на практических данных. Апробация еѐ научной значимости осуществлена в третьей главе диссертационной работы на основе анализа данных ведущих предприятий строительной отрасли г. Тюмени.
Выводы по второй главе:
Выявлено, что в настоящее время не существует универсальной методики оценки экономического потенциала строительного предприятия.
Для его оценки в основном применяются методы, используемые для
93 анализа финансово-хозяйственной деятельности предприятия, и сводятся к простому оцениванию различных имеющихся ресурсов предприятия.
Основной сложностью при разработке интегрированного показателя оценки экономического потенциала является несоизмеримость его образующих элементов, поэтому одним из важнейших методологических вопросов является вопрос выбора единичного измерителя всех составных частей входящих в экономический потенциал.
Установлено, что при расчетах уровня экономического потенциала часто применяются различные весовые коэффициенты для каждого субпотенциала образующего экономический потенциал или для каждого показателя данных субпотенциалов. Однако использование коэффициентов значимости представляется мало возможным, т.к. в современных условиях динамично развивающейся экономики, неполноты и труднодоступности информации, веса, приписываемые различным целям, будут являться быстропеременными, что непосредственно скажется на точности расчетов уровня экономического потенциала.
Разработан интегральный показатель для оценки экономического потенциала строительного предприятия, который позволяет учесть все важные сферы деятельности предприятия, определить сильные и слабые стороны, исследовать степень развития компонент, составляющих экономический потенциал предприятия, и служит индикатором уровня экономическо потенциала.
Установлено что экономический потенциал строительного предприятия представляет собой систему, обладающую синергетическим эффектом, который проявляется как в качественном составе системообразующих элементов экономического потенциала, так и от способа их соединения, гармонии и тесноты связей между ними, или организационной целостности. В связи с этим, для оценки экономического потенциала, обосновано применение кластерного анализа.
94
Предложена методика определения уровня экономического потенциала строительного предприятия на основе кластерного анализа, которая позволяет не только четко определить, каким уровнем экономического потенциала предприятие обладает, но и наглядно показывает за счет каких составляющих данный уровень формируется и какие показатели оказывают наибольшее влияние на тот или иной субпотенциал, что позволит предприятию выработать конкретную стратегию для достижения целевых позиций в отрасли.
95
1 2 3 4 5 6 7