Файл: Применение нейронных сете в экономике (Диагностика и прогнозирование нейронными сетями).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 25.06.2023

Просмотров: 78

Скачиваний: 5

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

В рамках теории вероятностей действовал В.А. Ковалевский (дискриминантный анализ), он также привлек идеи оптимизации. Он занимался и изображениями. Позднее В.Н. Вапник рассматривал минимизацию эмпирического риска и ввел важное понятие функции роста. Ю.И. Журавлев исследовал алгебраическую теорию распознавания. Вместе с И.Б. Гуревичем он предложил алгебраическую теорию анализа изображений. Н.Г. Загоруйко изучал машинное обнаружение закономерностей на основе распознавания, предложил некоторые методы таксономии. Его работы также относятся к линии логики в распознавании. К логическим методам распознавания обратился А.Л. Горелик, он изучил установление истинности высказываний на основе ряда эмпирических высказываний об объектах.

К логическим методам в распознавании относятся работы Г.С. Лбова. В начале XXI в. работы по комитетам продолжили М. Ю. Хачай, А.И. Рыбин (комбинаторика и дискретное программирование), К.С. Кобылкин.

Глубокие математические разработки были привлечены для исследования полноты и плотности для слоистых нейронных сетей. Полнота идет от Д. Гильберта (13-я проблема), плотность — от К. Вейерштрасса, затем М. Стоуна. Для доказательства полноты использованы теоремы А.Н. Колмогорова и В.И. Арнольда о представлении функций многих переменных в виде суперпозиций функций меньшего числа переменных. Плотность после обобщения теоремы М.Стоуна доказана Ли Ю (он работал в терминах алгебр, замкнутых относительно унарной нелинейной операции). Интерпретация указанных выше результатов в терминах нейронных сетей сделана Р. Хехт-Нильсеном, затем А.Н.Горбанем.

Клини рассмотрел в 1956 г. представление событий в нейронных сетях и конечных автоматах. Дж. фон Нейман в том же сборнике рассмотрел вероятностную логику и синтез надежных алгоритмов из ненадежных компонентов. Здесь усматривается аналогия с комитетами. Метод МГУА (метод группового учета аргументов) (А.Г.Ивахненко, 1960-е) тоже может быть истолкован в рамках нейросетей. В. М.Глушков (50–60-е гг.) изучал возможности персептронов с точки зрения теории алгоритмов. Метод МГУА и метод Г.С. Лбова (СПА — случайный поиск с адаптацией) дали, также примыкающие к этой тематике последующие методы генетических алгоритмов (в полной мере это сделал Дж. Холланд в 1975 г.).

Б.Б.Розин рассмотрел вопросы применения распознавания в экономике, в том числе при моделировании экономико-статистических закономерностей (1970-е).

Работы А.И.Галушкина по нейронным сетям ведутся с 60-х гг. В них рассматриваются некоторые возможности сетей нейронов. Линия от Мангасариана: сведение к математическому программированию, работы по методу опорных функций. Впрочем, он просто опубликовал более широко свои результаты (схожие с ними получил И.И.Еремин в 1953 г.).


Отдельно выделим теорию голосования (хотя она имеет непосредственное отношение к комитетам). Плиний младший, Архимед, Аристотель поставили некоторые проблемы голосования. М.Кондорсе и Ж.-Ш.Борде в Парижской АН нашли парадоксы голосования.

Значительный и почти окончательный шаг сделал К.Эрроу. В рамках искусственного интеллекта изучались машинное зрение; использование фреймов, эмпирического логического вывода следствий из системы посылок; анализ сцен — 1970-е гг. Тогда же М. Минский, С.Пейперт исследовали возможности распараллеливания вычисления геометрических предикатов от фигур.

1.2 Диагностика и прогнозирование нейронными сетями

При диагностике и прогнозировании экономических объектов часто используются веса факторов, которые даются экспертами, а далее проводится голосование мнений экспертов. Однако такие процедуры могут быть некорректными, и существующий аппарат построения корректных процедур достаточно трудно использовать для получения практически значимых решений. Поясним это. Рассмотрим задачу диагностики объектов коллективами экспертов, используя коалиции в задаче коллективного предпочтения. Пусть Х – множество вариантов, из которых нам надо выбрать – по некоторым критериям – определённый вариант х. Пусть проблемой такого выбора занимается набор экспертов или лиц, принимающих решения, набор С. В случае, когда выбор осуществляется на основе предпочтений, каждый член f набора С – это фактически бинарное отношение предпочтения r(f). Это значит, что для некоторых х,у из Х может иметь место утверждение х r(f) y, это значит: для f будет х предпочтительнее, чем у. Коллективное предпочтение r = r ( C ) можно считать некоторой функцией от индивидуальных предпочтений : r = ф( r(f): f пробегает набор С). На первый взгляд такое предположение кажется естественным, но именно оно является источником дальнейших противоречий. Оказалось, что коллективное предпочтение не может быть универсальным правилом, оно зависит от конкретных вариантов х,у и от предпочтений r(f). Иными словами, правило ф не может быть универсальным, оно должно быть локальным.

Нами показано, что при сведении задачи к классификационной можно строить коллективы экспертов (комитеты), корректно решающие задачу диагностики методы обучения нейро сетей в двух слоях, а затем метод комитетов позволил получить точные результаты и обоснованные процедуры обучения, которые позволяют решать широкий класс задач, сводимых к разделению конечных множеств с единственным требованием непустоты их пересечения.


Одно важное направление связано с процедурами голосования при оценке состояний объектов. В сфере голосования ситуация крайне сложна, и здесь на каждом шагу встречаются парадоксы. Нами показано, что противоречий удаётся избежать в случае, когда решение задачи выбора сведено к серии задач классификации, и в этом случае метод комитетов даёт хорошие результаты. Методу комитетов отвечает трёхслойная нейронная сеть, и из теорем существования комитетов следует, что такую сеть можно обучить по прецедентам решению любой задачи, решение которой выражается словом в каком–либо конечном алфавите.

Приведём аргументы в пользу сведения принятия решений к сериям задач классификации. Близкая многокритериальной оптимизации процедура коллективных решений является важнейшей в задачах выбора вариантов. Проблема принятия согласованных решений коллективом людей или коллективом решающих правил возникает постоянно в задачах прогнозирования. Однако оказалось, что нельзя априори предложить наиболее эффективную процедуру голосования. Она всегда зависит от конкретной ситуации и фактически при грамотном подходе превращается в процесс согласования интересов сторон – процесс, требующий большой аккуратности, чтобы не попасть в одну из многочисленных формальных ловушек. Это важно для диагностики коллективами экспертов. Фактически, это игра нескольких лиц, где выигрывает тот, кто хорошо считает и использует малейшие просчёты партнёров. Изучение задачи согласования индивидуальных мнений экспертов и лиц, принимающих решения (ЛПР) сегодня перешло на качественно новый математический уровень.

Решение почти любой задачи можно представить в виде схемы:

Задача Z -> параметризатор S -> x = [x1,…,xn] -> решатель -> arg Z = f(x). Решатель – это компьютер того или иного вида. Вместо того, чтобы говорить об алгоритме решения задачи Z из класса З, будем говорить об алгоритме, позволяющем с помощью программы П восстанавливать по последовательности (коду) х из Х последовательность ( код) y = argZ, y – из Y.

Собственно говоря, этот круг вопросов связан с идеей расщепления сложной задачи в сеть простых задач. Эта идея реализована в разных разделах математики под разными названиями: модульный принцип в пакетах программ (Н.Н. Яненко), принцип расщепления в математической физике (Г.И. Марчук), метод декомпозициии в оптимизации, метод конечных элементов в вычислительной физике и т.д. Спрашивается, можно ли синтезировать решение большой сложной задачи из множества решений подзадач?


Итак, мы решаем следующую конкретную задачу.

Требуется по данным наблюдений (таблица объект\признак) выявить закономерности вида y = f(x), где у – целевой показатель, х – вектор входных признаков (факторов). На основании этой информации провести прогноз параметров деятельности экономических объектов. Зависимость требуется получить в нейросетевой форме.

С этим подходом связана задача управления признаками. Эта задача распадается на ряд этапов: селекция признаков, преобразование признаков (построение спрямляющего пространства), оценка отдельных признаков и их совокупностей, оценка влияния вариаций признаков на результат классификации.

Настройка нейронной сети на моделирование зависимости y = f(x) сводится к дискриминантному анализу.

Итак, для моделирования эмпирических закономерностей мы рассматриваем задачу дискриминантного анализа – задачу построения функции f из функционального класса F, разделяющую прецедентные множества А и В. Эту задачу обозначим DA(A,B,F): найти f из F: f(x)>0 для х из А, f(x)<0 для х из В.

Разделяющий комитет: C = [ f1,…,fq], причем каждому неравенству нашей задачи удовлетворяет более половины элементов из С.

Эти задачи решаются на основе накопленных наблюдений по динамике показателей. Распознавание образов и регрессионный анализ используются для нахождения эмпирических зависимостей между показателями. Далее на этой основе рассматриваются оценки признаков и систем признаков, отбор полезных признаков и их отбор. А именно, пусть f = arg DA(A,B,F), то есть f - разделяющая функция для множеств А и В. Если имеется вектор состояния объекта: x = [x1,…,xn], который мы хотим перевести в класс А, то мы решаем задачу управления признаками: найти y = [y1,…,yn], чтобы f(x+y) > 0. В более общей модели u – оператор управления, действующий на вектор состояния х так, чтобы в результате х можно было перевести в нужный класс.

Это связано с оценкой факторов: ценность фактора ( входного показателя) xi –это эластичность критериальных (целевых) функций f1,…,fp по отношению к фактору xi, val(x) = матрица, составленная из векторов gradfj(x).

Для детализации содержательной схемы моделирования работы экономического объекта мы должны учесть тот факт. что построение адекватной математической модели экономических показателей требует разработки содержательной концепции экономического и производственного процесса на промышленном объекте и его формализации. Результат – выделение входных и выходных показателей.


Глава 2. Применение нейронных сетей

2.1 Применение нейронных сетей в экономике

Экономика — в значительной степени неформализованная наука (хотя она и содержит формализованные разделы и частично опирается на формальные методы). Поэтому в ней так важно использовать накопленный опыт, прецеденты, эмпирические закономерности и экспертные априорные предположения. Этим объясняется тот факт, что в экономике такое большое значение имеют методы обучения диагностике, прогнозированию и выбору вариантов на основе материала наблюдений.

Прецедентно-классификационный принцип принятия решений — это реально работающий принцип, средство развязки неизбежно возникающих противоречий выбора решений и агрегирования индивидуальных схем и критериев выбора в коллективе.

Общее определение распознавания образов: это дисциплина, изучающая математические модели и методы классификации, диагностики и прогнозирования свойств объектов на основе измерения их прямых и косвенных характеристик (признаков), с использованием материала обучения (прецедентов) и априорной информации.

Далее приведем (для иллюстрации) пример применения распознавания образов в экономике, относящийся к инновациям. Для расчетов эффективности управления процессами инноваций необходимы методы исследования устойчивости динамики технологий. Каковы подходы к решению этой задачи?

Один из подходов может основываться на применении теории двойственности в математическом программировании и распознавании образов. Дело в том, что соотношения двойственности позволяют оценить колебания решения задачи оптимизации и классификации при вариациях данных. В перспективе для этого полезно разработать пакет прикладных программ анализа прямых и двойственных задач математического программирования и распознавания образов. Необходимы также имитационные системы, методы прогнозирования и диагностики состояний технологий. Были бы полезны экспертные системы и нейронные сети. В качестве основной теоретической конструкции необходимо использовать модели принятия решений по развитию технологий в условиях ограниченных ресурсов. Полезна модель прогнозирования области неопределенности развития больших систем (Б.Б.Розин, А.В.Беккер, Н.В.Вотрина) с применением таксономии и теории статистических решений. В этой области весьма полезны аппарат нестационарных процессов математического программирования и распознавания образов, аппарат неформализованных задач оптимизации и классификации, а также теория и методы несобственных экстремальных задач. Предполагается также применить — для определения подходящих вариантов инноваций — сравнение территорий, их взаимное оценивание на основе математической статистики и распознавания образов.