Файл: Применение нейронных сете в экономике (Диагностика и прогнозирование нейронными сетями).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 25.06.2023

Просмотров: 87

Скачиваний: 5

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Один из путей снятия таких парадоксов — в расширении представления об объектах, ослаблении накладываемых при определении объекта требований, их «размывании», расширении смысла понятия существования объекта. Один из путей реализации этого подхода заключается в применении понятий непрерывной и дискретных аппроксимаций. Слабо формализуемые факторы, влияющие на выход прогнозируемого процесса, происходящего в какой-либо экономической системе, могут быть учтены с помощью распознавания образов.

Идея одной из моделей распознавания образов — в обучении диагностике новых ситуаций (и принятию в них решений) на основе прецедентов.

Пусть ситуация, в которой нужно принять решение, описывается вектором из пространства Rn и имеется материал обучения: A — подмножество пространства Rn , а именно множество ситуаций, где нужно принять решение u1, B — подмножество, на котором надо принимать решение u2 . Примеры практических задач такого типа: диагностика экономических систем, диагностика в технике, прогноз показателей результатов воздействия, вообще прогноз каких-либо эмпирических зависимостей и показателей. Есть еще пример — многошаговая задача принятия решений. Пусть заданы вероятности перехода от одной ситуации к другой. Тогда можно вычислить оптимальную суммарную ожидаемую эффективность за n шагов, а затем воспользоваться рекуррентным соотношением динамического программирования для определения оптимального выбора решений в многошаговом процессе. При этом неформальные составляющие можно учесть с помощью распознавания.

2.2 Нейро-сетевые модели бизнес-прогнозирования

В настоящее время, на наш взгляд, самым перспективным количественным методом прогнозирования является использование нейронных сетей. Можно назвать много преимуществ нейронных сетей над остальными алгоритмами, ниже приведены два основных.

При использовании нейронных сетей легко исследовать зависимость прогнозируемой величины от независимых переменных. Например, есть предположение, что продажи на следующей неделе каким-то образом зависят от следующих параметров:

  1. продаж в последнюю неделю
  2. продаж в предпоследнюю неделю
  3. времени прокрутки рекламных роликов (TRP)
  4. количества рабочих дней
  5. температуры

Кроме того, продажи носят сезонный характер, имеют тренд и как-то зависят от активности конкурентов.


Хотелось бы построить систему, которая бы все это естесственным образом учитывала и строила бы краткосрочные прогнозы.

В такой постановке задачи большая часть классических методов прогнозирования будет просто несостоятельной. Можно попробовать построить систему на основе нелинейной множественной регрессии, или вариации сезонного алгоритма ARIMA, позволяющей учитывать внешние параметры, но это будут модели, скорее всего, малоэффективные (за счет субъективного выбора модели) и крайне негибкие.

Используя же даже самую простую нейросетевую архитектуру (персептрон с одним скрытым слоем) и базу данных (с продажами и всеми параметрами) легко получить работающую систему прогнозирования. Причем учет, или не учет системой внешних параметров будет определяться включением, или исключением соответствующего входа в нейронную сеть.

Более искушенный эксперт может с самого начала воспользоваться каким-либо алгоритмом определения важности (например, используя Нейронную сеть с общей регрессией и генетической подстройкой) и сразу определить значимость входных переменных, чтобы потом исключить из рассмотрения мало влияющие параметры.

Еще одно серьезное преимущество нейронных сетей состоит в том, что эксперт не является заложником выбора математической модели поведения временного ряда. Построение нейросетевой модели происходит адаптивно во время обучения, без участия эксперта. При этом нейронной сети предъявляются примеры из базы данных, и она сама подстраивается под эти данные.

Недостатком нейронных сетей является их недетерминированность. Имеется в виду то, что после обучения имеется "черный ящик", который каким-то образом работает, но логика принятия решений нейросетью совершенно скрыта от эксперта. В принципе, существуют алгоритмы "извлечения знаний из нейронной сети", которые формализуют обученную нейронную сеть до списка логических правил, тем самым создавая на основе сети экспертную систему. К сожалению, эти алгоритмы не встраиваются в нейросетевые пакеты, к тому же наборы правил, которые генерируются такими алгоритмами достаточно объемные. Подробнее об этом можно почитать в книге А.А. Ежова, С.А. Шумского "Нейрокомпьютинг и его применения в экономике и бизнесе".

Тем не менее, для людей, умеющих работать с нейронными сетями и знающими нюансы настройки, обучения и применения, в практических задачах непрозрачность нейронных сетей не является сколь-нибудь серьезным недостатком.

Использование многослойных персептронов.


Самый простой вариант применения искусственных нейронных сетей в задачах бизнес-прогнозирования - использование обычного персептрона с одним, двумя, или (в крайнем случае) тремя скрытыми слоями. При этом на входы нейронной сети обычно подается набор параметров, на основе которого (по мнению эксперта) можно успешно прогнозировать. Выходом обычно

является прогноз сети на будущий момент времени Рисунок 1. (приложение А).

Рассмотрим пример прогнозирования продаж. На рисунке 2 представлен график, отражающий историю продаж некого продукта по неделям. В данных явно заметна выраженная сезонность. Для простоты предположим, что никаких других нужных данных у нас нет. Тогда сеть логично строить следующим образом. Для прогнозирования на будущую неделю надо подавать данные о продажах за последние недели, а также данные о продажах в течении нескольких недель подряд год назад, чтобы сеть видела динамику продаж один сезон назад, когда эта динамика была похожа на настоящую за счет сезонности.

Если входных параметров много, крайне рекомендуется не сбрасывать их сразу в нейронную сеть, а попытаться вначале провести предобработку данных, для того чтобы понизить их размерность, или представить в правильном виде. Вообще, предобработка данных - отдельная большая тема, которой следует уделить достаточно много времени, так как это ключевой этап в работе с нейронной сетью. В большинстве практических задач по прогнозированию продаж предобработка состоит из разных частей. Вот лишь один пример.

Пусть в предыдущем примере у нас есть не только историческая база данных о продажах продукта, которые мы прогнозируем, но и данные о его рекламе на телевидении. Эти данные могут выглядеть следующим образом :

Рисунок 2 - график, отражающий историю продаж некого продукта по неделям

По оси времени отложены номера недель и рекламные индексы для каждой недели. Видно, что в шестнадцатую и семнадцатую недели рекламы не было вообще. Очевидно, что неправильно данные о рекламе подавать в сеть (если это не рекуррентная нейронная сеть) в таком виде, поскольку определяет продажи не сама реклама как таковая, а образы и впечатления в сознании покупателя, которые эта реклама создает.

И такая реклама имеет продолжительное действие - даже через несколько месяцев после окончания рекламы на телевидении люди будут помнить продукт и покупать его, хотя, скорее всего, продажи будут постепенно падать.


Поэтому пытаясь подавать в сеть такие данные о рекламе, мы делаем неправильную постановку задачи и, как минимум, усложним сети процесс обучения.

При использовании многослойных нейронных сетей в бизнес-прогнозировании в общем и прогнозировании продаж в частности полезно также помнить о том, что нужно аккуратно делать нормировку и что для выходного нейрона лучше использовать линейную передаточную функцию. Обобщающие свойства от этого немного ухудшаются, но сеть будет намного лучше работать с данными, содержащими тренд.

Использование нейронных сетей с общей регрессией GRNN и GRNN-GA

Еще одной часто используемой нейросетевой архитектурой, используемой в бизнес-прогнозировании является нейронная сеть с общей регрессией.

Несмотря на то, что принцип обучения и применения таких сетей в корне отличается от обычных персептронов, внешне сеть используется таким же образом, как и обычный персептрон.

Говоря другими словами, это совместимые архитектуры в том смысле, что в работающей системе прогнозирования можно заменить работающий персептрон на сеть с общей регрессией и все будет работать. Не потребуется проводить никаких дополнительных манипуляций с данными.

Если персептрон во время обучения запоминал предъявляемые примеры постепенно подстраивая свои внутренние параметры, то сети с общей регрессией запоминают примеры в буквальном смысле.

Каждому примеру - отдельный нейрон в скрытом слое сети, а затем, во время применения сеть сравнивает предъявляемый пример с примерами, которые она помнит. Смотрит, на какие из них текущий пример похож, и в какой степени и на основе этого сравнения выдаст ответ.

Отсюда следует первый недостаток такой архитектуры - когда база данных о продажах, или других величинах, которые мы прогнозируем велика, сеть станет слишком большой и будет медленно работать. С этим можно бороться предварительной кластеризацией базы данных.

Второй недостаток таких сетей особенно заметен в задачах бизнес-прогнозирования - они совсем не способны "продлевать" тренд. Поэтому такие сети можно использовать только в случаях, когда рынок устойчивый, либо, после декомпозиции данных, тренд прогнозировать другими архитектурами нейронных сетей, или любыми классическими методами.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. Терехов В.И., Жуков Р.В. Методика подготовки данных для обработки импульсными нейронными сетями//Нейрокомпьютеры: разработка, применение. 2017. №2. С. 31-36.


2. Чаркин Е.И. Стратегическое развитие информационных технологий и связи//Автоматика, связь, информатика. 2017. №4. С. 2-5.

3. Кульневич А.Д. Введение в нейронные сети//Молодой ученый. 2017. №8. С. 31-36.

4. Доничев О.А., Романова А.Д., Баринов М.А. Методология оценки инновационного потенциала социально-экономических систем//Региональная экономика: теория и практика. 2017. №1. С. 169-181.

5. Гуреева О.А., Потапова М.С. Обучающие и тестовые данные для нейронных сетей//Nauka i studia. 2017. Т.1. №3. С. 75-77.

6. Уоссерман Ф. Нейрокомпьютерная техника. — М.: Мир, 2012.

7. Нейрокомпьютеры и интеллектуальные роботы / Н .М. Амосов, Т.Н. Байлык, А.Д. Гольцов и др. — Киев: Наукова думка, 2011.

8. Ширяев В. И. Финансовые рынки. Нейронные сети, хаос и нелинейная динамика; Либроком - Москва, 2013. - 232 c.

9. Шувалов, В.П. и др. Телекоммуникационные системы и сети. Мультисервисные сети; Горячая Линия Телеком - Москва, 2015. - 592 c.

10. Яхъяева Г. Э. Нечеткие множества и нейронные сети; Интернет-университет информационных технологий, Бином. Лаборатория знаний - Москва, 2011. - 320 c.

11. Яхъяева, Г.Э. Нечеткие множества и нейронные сети; Интернет-университет информационных технологий - Москва, 2016. - 320 c.

ЗАКЛЮЧЕНИЕ

Все чаше появляются научные работы, посвященных нейро-сетевым моделям, которые порождают все больше интересных, эффективных технологий для решения задач управления, планирования, распознавания образов и принятия решений. В этом разнообразии мы выделили лишь то направление, которое непосредственно связано с принципами человеческого интеллекта, с ассоциативным мышлением. Фактически это — построение таблиц, фиксирующих опыт и реализующих принцип «если — то», «посылка — следствие». Важным достоинством этих таблиц является то, что они позволяют наглядно воспроизводить функции многих переменных, не совместимых по типам и по физической природе. Эти функции не имеют формального математического описания и потому отображают трудно формализуемые задачи. Автоматическая интерполяция опыта является неотъемлемым свойством нейронной сети. Она позволяет делать вывод «на что больше всего это похоже и что следует предпринять», а также производить необходимое усреднение.

Важнейшее значение нейронные сети приобретают при построении систем управления и принятия решений. Технологии, основанные на применении «вычислительных» алгоритмов, приводят к тупиковой ситуации, когда традиционно развиваемая элементно-конструкторская база не обеспечивает требуемой производительности компьютеров. Нейросетевые технологии, использующие нетрудоемкий принцип ассоциативного мышления и высокий параллелизм, порождают прорыв в достижении необходимой реальной производительности вычислительных средств.