Файл: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ НЕЙРОННЫХ СЕТЕЙ.pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 18.06.2023

Просмотров: 145

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Оценка валютных рисков. Прогнозирование котировок на валютном рынке.

Оценка кредитных рисков. Прогноз эффективности кредитования.

Оценка торговых рисков. Исследование фактора спроса. Прогнозирование и анализ цен. Прогнозирование продаж.

Использование нейросетевой технологии применимо в ситуациях, когда формализация процесса решения сложна или совсем невыполнима. Нейросети представляют собой мощный инструмент моделирования, поскольку они нелинейны. Линейное моделирование долго было основным во множестве областей, потому что для него есть много методов оптимизации. Впрочем, в задачах анализа рисков способы линейного моделирования в подавляющем большинстве случаев неприменимы. Помимо всего прочего, у нейронных сетей нет проблемы «проклятия размерности», не позволяющей моделировать линейные зависимости от большого числа переменных.

В первую очередь нейронная сеть применяется, когда точный вид связи между входом и выходом неизвестен. Необходимо только точно знать, что существует связь между входными и выходными данными. А сама зависимость будет выведена по мере обучения нейронной сети.

Модель нейронной сети для предсказания финансовой несостоятельности организации

Для создания нейронной сети нужно разработать ее топологию, определить механизм обучения, и процедуру тестирования. Помимо этого, для обучения нужны входные данные - подборка компаний с проверенной финансовой отчетностью и рассчитанные на ее основе коэффициенты.

На основании анализа задачи было принято решение остановиться на модели трехслойного персептрона (см. рис. 1) и алгоритме обратного распространения в качестве обучающего.

Рис 1. Трехслойный персептрон.

Данный вид нейронных сетей достаточно хорошо изучен и описан в разных научных статьях. Он был предложен в работе Румельхарта и подробно обсуждается почти во всех учебниках по нейронным сетям [8, c. 93]. Каждый элемент сети строит взвешенную сумму своих входов с поправкой в виде слагаемого и затем пропускает эту величину активации через передаточную функцию, получая, таким образом, выходное значение этого элемента. Элементы организованы в послойную топологию с прямой передачей сигнала. Такую сеть легко можно интерпретировать как модель вход-выход, в которой веса и пороговые значения (смещения) являются свободными параметрами модели. Сеть может моделировать функцию практически любой степени сложности, причем число слоев и число элементов в каждом слое определяют сложность функции. Определение числа промежуточных слоев и числа элементов в них является важным вопросом при конструировании многослойных нейронных сетей. Количество входных и выходных элементов определяется условиями задачи.


Использован самый известный вариант алгоритма обучения нейронной сети - т.н. алгоритм обратного распространения [9, c. 209]. В алгоритме обратного распространения вычисляется вектор градиента поверхности ошибок. Этот вектор указывает направление кратчайшего спуска по поверхности из данной точки, поэтому если мы «немного» продвинемся по нему, ошибка уменьшится. Последовательность таких шагов (замедляющаяся по мере приближения к дну), в конце концов, приведет к минимуму того или иного типа. Определенную трудность здесь представляет вопрос о том, какую нужно брать длину шагов.

Если взять большую длину шага, то сходимость будет более быстрой, но есть угроза «перескочить» через решение или пойти по неверному пути. Классическим примером такого явления при обучении нейронной сети является ситуация, когда алгоритм очень медленно продвигается по узкому оврагу с крутыми склонами, прыгая с одной его стороны на другую. С другой стороны, при маленьком шаге, скорее всего будет выбрано правильное направление, но при этом необходимо будет очень много итераций. На практике величина шага берется пропорциональной крутизне склона (так что алгоритм замедляет ход вблизи минимума) с некоторой константой, которая называется скоростью обучения. Правильный выбор скорости обучения зависит от конкретной задачи и обычно осуществляется опытным путем; эта константа может также зависеть от времени, уменьшаясь по мере продвижения алгоритма.

Таблица 1. Конфигурация сети

Общие параметры

Параметры скрытого слоя

Параметры выходного слоя

Количество узлов во входном слое:10

Коэффициент
обучения: 0.25

Коэффициент
обучения: 0.01

Число узлов в скрытом
слое:10

Коэффициент
инерции: 0.6

Коэффициент
инерции: 0

Число узлов в
выходном слое:1

Затухание:0

Затухание:0

Алгоритм обучения:
Обратное распространение

Функция активации:
сигмоидальная

Способность сети к обучению будет зависеть от точности подбора данных параметров. Входные узлы соответствуют финансовым коэффициентам, используемым для предсказания несостоятельности. Значение единственного узла выходного слоя - показатель финансовой состоятельности предприятия. Единичное значение соответствует состоянию банкротства, нулевое - полному финансовому благополучию. В качестве активационной функции выбрана сигмоидальная.


В качестве входных данных используется разработанный набор финансовых коэффициентов. Базовые параметры модели Альтмана [11, с 61] были дополнены набором собственных. При этом при выборе параметров модели основное внимание уделялось не соответствию расчета выбранных коэффициентов общепринятым методикам финансового анализа, а влияние исходного набора данных на качество обучения сети и, как следствие, эффективность ее прогнозирования.

Таблица 1. Входные параметры сети

k1 = Оборотный капитал/Активы

k2 = Нераспределенная прибыль/Активы

k3 = Прибыль до налогообложения/Активы

k4 = Объем продаж/Активы

k5 = Рыночная стоимость собственного капитала/Активы

k6 = Чистый денежный поток/Активы

k7 = Чистый денежный поток/Общая задолженность

k8 = Оборачиваемость активов/ Текущие обязательства

k9 = Оборачиваемость активов/Выручка

k10 = Общая задолженность/Активы

Как уже было сказано, коэффициенты обучения и инерции являются параметрами алгоритма обратного распространения и определяют скорость и точность определения весов, минимизирующих ошибку предсказания. Большие значения этих параметров позволяют алгоритму сходиться за меньшее число итераций, но при этом возрастает риск “проскочить” оптимальное решение. Слишком малые значения, хотя и позволяют с высокой вероятностью определять глобальный минимум, неоправданно увеличивают время работы алгоритма. Экспериментальным путем были подобраны оптимальные значения для данной конфигурации многослойного персептрона.

Сбор статистики по предприятиям наряду с выбором модели и конфигурации является не менее важным в задаче прогнозирования банкротства. Так же надо понимать, что выбор разных предприятий зависит от того какие цели обучения стоят перед нейросетью. Если рассматривать компании определенной отрасли на выбранном временном отрезке, вероятно, что сеть хорошо научится предсказывать финансовую несостоятельность предприятий данного типа в рассматриваемом временном промежутке, но будет непригодна для оценки компаний из других областей. С другой стороны, если взять предприятия разных отраслей в произвольном временном периоде, то точность прогнозирования будет снижаться.

Данная конфигурация нейронной сети разрабатывалась для промышленных предприятий. Ее меньшая пригодность для прогнозирования банкротства компании финансового сектора вызвана особенностями ведения бухгалтерского учета. Как следствие, ряд входных параметров разработанной модели не несет в себе значимой информации для организаций непромышленной сферы.


В качестве исходных данных бралась финансовая отчетность 100 компаний (в качестве источника данных использовалась база данных Compustat Industrial Database). Все компании были разбиты на 2 одинаковых множества по 50 компаний -обучающее множество и тестирующее множество. Деятельность организаций рассматривалась в период с 1993 по 1997 год, что позволило включить в модель влияние различных внешних факторов. Соотношение обанкротившихся и финансово устойчивых предприятий в каждой выборке не было равным. Данный фактор негативным образом мог сказаться на качестве обучения сети.

Для оценки правильности модели была собрана статистика по фирмам за 3 года до их банкротства (для благополучных компаний - за 3 года предшествующих произвольной дате существования предприятия) и нейронная сеть обучена на данных финансовой отчетности каждого года. Цель теста была увидеть, насколько хорошо модель прогнозирует состояние организации через год, через 2 года и через 3 года. Как уже было сказано, обучение проводилось с использованием данных отчетности 50 предприятий, эти же данные были включены в обучающее множество, на котором проводился первый этап тестирования. На основании финансовой информации об оставшихся 50 предприятиях было сформировано тестирующее покрывающее множество, которое использовалось для оценки “обобщающей способности” модели. Были получены следующие результаты:

Таблица 3. Точность прогнозирования банкротства нейронной сетью

Обучающее множество

Общий
показатель

Для благополучных
компаний

Для несо-
стоятельных

Год 0

97%

49%

48%

Год 1

87%

44%

43%

Год 2

83%

43%

40%

Тестирующее множество

Общий
показатель

Для благополучных
компаний

Для несо-
стоятельных

Год 0

88%

40%

48%

Год 1

77%

37%

40%

Год 2

61%

32%

29%

Модель, как и ожидалось показала хорошие результаты для обучающего множества и значительно более низкие для тестирующего множества. Особенно интересным в анализе результатов прогнозирования для компаний из тестирующего множества, представляется факт высокой вероятности предсказания банкротства в первые два года.


НЕЙРОННЫЕ СЕТИ В УПРАВЛЕНИИ РОЗНИЧНОЙ ТОРГОВЛЕЙ

Регулярная оценка товарооборота как одного из важных показателей деятельности розничного торгового предприятия позволяет оперативно реагировать на происходящие изменения и прогнозировать развитие торговых предприятий. Оценка должна носить комплексный характер и осуществляться на основе определённых принципов, таких как достоверность, объективность, оперативность, научность, системность, комплексность, соответствие получаемого и желаемого результата.

Главная сложность анализа деятельности розничных торговых предприятий заключается в том, что они подвержены влиянию различных факторов внутренней и внешней среды предприятия и относятся к динамическим социально - экономическим системам. Более востребованными становятся алгоритмы интеллектуальной поддержки при принятии организационно-управленческих решений.

Для анализа и управления в социально-экономических системах используются различные методы, такие как теория массового обслуживания, статистические методы, метод экспертных оценок и другие методы эконометрики.

Отметим, что комплексный анализ в таком сложном по структуре информационном поле без определённых преобразований не поддаётся обработке указанными методами. Сложно также оценить взаимосвязь и влияние факторов друг на друга. Методы искусственных нейронных сетей и нечёткой логики позволяют устранить отмеченные недостатки.

Практически невозможно предсказать влияние случайных факторов колебания спроса, которые могут быть вызваны в результате изменения экономической ситуации, стихийными бедствиями, политическими решениями, поэтому надо учитывать, что область распределения возможных фактических значений спроса будет находиться в определенном интервале (а не обязательно совпадать с прогнозом), гарантирующем определенную вероятность прогноза.

Практическое применение рассмотренного подхода к формированию спроса на предприятиях розничной и оптовой торговли, а в дальнейшем и его прогнозирования становится возможным при использовании электронно-вычислительной техники и автоматизированных систем управления. Это позволяет прогнозировать уровень и объем сделок, решать задачи оперативного прогнозирования спроса для обоснования заявок на поставку товаров, заказов при заключении договоров и контрактов.