Добавлен: 18.06.2023
Просмотров: 147
Скачиваний: 3
СОДЕРЖАНИЕ
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ НЕЙРОННЫХ СЕТЕЙ
ОБЛАСТЬ ПРИМЕНЕНИЯ НЕЙРОННЫХ СЕТЕЙ В ЭКОНОМИКЕ
ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ФИНАНСОВЫХ ВРЕМЕННЫХ РЯДОВ
ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ОЦЕНКИ И УПРАВЛЕНИЯ РИСКАМИ ПРЕДПРИЯТИЯ
НЕЙРОННЫЕ СЕТИ В УПРАВЛЕНИИ РОЗНИЧНОЙ ТОРГОВЛЕЙ
Для прогнозирования финансовых временных рядов возможно использование многослойных персептронов. Использование сетей с обратными связями в данном случае нецелесообразно в связи с трудностью обучения таких сетей и неактуальностью основной характеристики сетей с обратными связями - краткосрочной памяти.
Надо взять в толк, какие входы давать сети и какие данные получать на выходе. В общем случае входы сети отображают динамику торгов (цены и объемы) по исследуемому инструменту за некоторый предшествующий отрезок времени. Выходом сети обычно выбирается изменение цены исследуемого финансового инструмента в будущем. Подобный выход разрешает игроку брать на себя решение о совершении сделок на рынке.
Методы разработки и внедрение нейронной сети
Рассмотрев, что представляют собой нейронные сети и особенности биржевой деятельности, охарактеризуем некоторые методы построения нейронной сети и ее внедрение.
Выделим два основных этапа для решения поставленной задачи:
- разработка структуры нейронной сети;
- обучение нейронной сети.
Первый этап можно разделить на следующие пункты:
- выбор типа нейронов (формирует нейронную сеть);
- выбор типа межнейронных связей;
- определение входных и выходных данных.
Второй этап, на котором происходит обучение выбранной нейронной сети, а конкретно выборка необходимых значений весов для того, чтобы точность прогнозирования нейронной сети соответствовала заданным параметрам. Для данного алгоритма выберем метод обратного распространения ошибки, наиболее простой и подходящий для простого перцептрона. Есть и другие алгоритмы обучения, но этот достаточно быстро дает результат, прост в применении и часто применяется с перцептронами. На начальных стадиях разработки этот алгоритм будет наиболее оптимален.
Формирование входов нейронной сети
Несмотря на то что предсказания являются экстраполяцией данных, нейросети на самом деле решают задачу интерполяции, что существенно повышает надежность решения. Предсказание временного ряда сводится к типовой задаче нейроанализа - аппроксимации функций многих переменных по заданному набору примеров с помощью процедуры погружения ряда в многомерное пространство.
Для динамических систем доказана следующая теорема Такенса. Если временной ряд порождается динамической системой, то есть значения Хt есть произвольные функции состояния системы, то существует такая глубина погружения d (примерно равная эффективному числу степеней свободы данной динамической системы), которая обеспечивает однозначное предсказание следующего значения временного ряда. Таким образом, выбрав достаточно большое d, можно гарантировать однозначную зависимость будущего значения ряда от его ё предыдущих значений:
Χt= f(Χt-d)
т.е. предсказание временного ряда сводится к задаче интерполяции функции многих переменных. Нейросеть далее можно использовать для восстановления этой неизвестной функции по набору примеров, заданных историей временного ряда [7, c. 112].
Хотя предсказание финансовых рядов сводится к задаче аппроксимации многомерной функции, оно имеет свои особенности как при формировании входов, так и при выборе выходов нейросети. Не маловажным является оценка качества финансовых предсказаний для выбора и построения наилучшей стратегии по обучению нейросети.
Не надо брать для входов и выходов нейросети сами значения котировок (обозначим их Сt) т.к значимыми для предсказаний являются изменения котировок. Так как эти изменения обычно гораздо меньше по амплитуде, чем сами котировки, между последовательными значениями курсов имеется большая корреляция - наиболее вероятное значение курса в следующий момент равно его предыдущему значению:
(Сt+1) = (Сt + ΔСt) = Сt + (ΔСt) Сt.
Для того что бы повысить качество обучения необходимо стремиться к статистической независимости входов, то есть к отсутствию подобных корреляций. Следовательно, для входных данных необходимо выбирать наиболее статистически независимые величины, к примеру изменения котировок ΔСt или логарифм относительного приращения:
Внедрение логарифма условного приращения считается успешным для долгих временных линий, когда уже видно воздействие инфляции. В этом случае простые разности в разных частях ряда будут иметь различную амплитуду, так как фактически измеряются в различных единицах. Напротив, отношения последовательных котировок не зависят от единиц измерения и будут одного масштаба несмотря на инфляционное изменение единиц измерения. В итоге большая стационарность ряда позволит использовать для обучения большую историю и обеспечит лучшее обучение.
Отрицательной чертой погружения в лаговое пространство является ограниченный «кругозор» сети, тогда как технический анализ не фиксирует окно в прошлом и использует достаточно далекие значения ряда. К примеру, утверждается, что максимальные и минимальные значения ряда даже в относительно далеком прошлом оказывают достаточно сильное воздействие на психологию игроков и, следовательно, должны быть важными для предсказаний. Если окно погружения в лаговое пространство недостаточно широкое, то оно не способно предоставить такую информацию, что, естественно, снижает качество предсказания. Но с обратной стороны, увеличение окна до таких размеров, когда захватываются далекие экстремальные значения ряда, повышает размерность сети, что соответственно приводит к снижению точности нейросетевого предсказания уже из-за увеличения размера сети.
Другой метод кодирования прошлого поведения ряда дает возможность решить эту проблему. Легко понять, чем глубже в прошлое уходит история ряда, тем меньше деталей его поведения оказывает влияние на результат предсказаний. Это обусловлено психологией субъективного восприятия прошлого участниками торгов, которые соответственно и формируют будущее. Из этого следует, что представление динамики ряда должно иметь выборочную точность т.е чем дальше в прошлое, тем меньше деталей - при сохранении общего вида кривой.
Одним из альтернативных способов кодирования временного ряда является использование в качестве входных данных значений индикаторов технического анализа на относительно далеком периоде времени и значений колебаний курса в текущем периоде.
Также достаточно перспективным инструментом здесь может оказаться вейвлетное разложение (wavelet decomposition). Оно эквивалентно по информативности лаговому погружению, но легче допускает такое сжатие информации, которое описывает прошлое с избирательной точностью.
При обучении нейросетей, предназначенных для прогнозирования финансовых временных рядов, используют стандартный подход. Имеющиеся примеры разбивают на три выборки: обучающую, валидационную и тестовую. Обучающая выборка предназначена для подстройки синаптических коэффициентов обучаемых нейронных сетей с целью минимизации ошибки на выходе сети. Валидационная выборка используется для выбора наилучших из нескольких обученных сетей и/или для определения момента останова обучения. Тестовая выборка, которая не использовалась в процессе обучения, служит для контроля качества прогнозирования.
В дополнение можно добавить небольшую программу, которая даст возможность сети автоматически обновлять данные, которые будут получены непосредственно из новостных каналов, электронных баз данных, сводок, распространяемых по электронной почте и т. д.
Используя описанный алгоритм, функциональность нейронной сети может быть существенно расширена для решения таких задач, как прогнозирование тренда рынка, анализ проведенных сделок, прогнозирование торговых сигналов, оценка рисков и т. д.
В результате получается действительно мощное оружие, способное, не отнимая времени и сил, вооружать знанием биржевых тенденций и даже подсказывать стратегию биржевой игры.
Для обучения нейросети недостаточно сформировать обучающие наборы входов-выходов. Необходимо также определить ошибку предсказаний сети. Среднеквадратичная ошибка не имеет большого «финансового смысла» для рыночных рядов. Например, для выбора рыночной позиции надежное определение знака курса боле важно, чем понижение среднеквадратичного отклонения. Хотя эти показатели и связаны между собой, сети, оптимизированные по одному из них, будут давать худшие предсказания другого.
Ошибка сети представляется в виде функции от синаптических коэффициентов и минимизируется одним из градиентных методов. Традиционно используют среднеквадратичную ошибку (суммирование производится по всем выходам):
где y - выход нейронной сети;
d - желаемое значение выхода.
Целью прогнозирования финансовых рядов является получение и максимизация прибыли. Поэтому в прогнозировании финансовых рядов важна не близость прогноза к истинному значению (что обеспечивает минимизация функции среднеквадратичной ошибки), а одинаковая направленность прогноза и истинного значения. Таким свойством обладает функция
E = -ln[l + yd]
Ошибку Е усредняют по всем примерам обучающей выборки, и полученное значение используют для подстройки синаптических коэффициентов [7, c. 174].
Использование комитета нейросетей
Применение разных архитектур сетей, вариативность выбора первоначальных синаптических коэффициентов, а также использование других отличающих сети параметров - все это приводит к тому, что предсказания различных нейронных сетей, обученных на одинаковых примерах, могут достаточно сильно отличатся. Самые «неудачные» варианты сетей отсеиваются на этапе валидации и тестирования. А более или менее «удачные» сети можно использовать совместно, организовав так называемый комитет сетей, используя для принятия решения значения выходов всех входящих в комитет сетей.
Легко показать, что среднее значение выходов комитета должно давать лучшие предсказания, чем средняя сеть из этого комитета [7]. Это следует из неравенства Коши
где - ɛi ошибка i-й сети в комитете;
L - количество сетей в комитете.
Из этого следует, что наиболее предпочтительно использовать для принятия решения среднее значение выходов комитета нейросетей. Более того, можно использовать не среднее значение выходов, а среднее взвешенное. Веса выбираются адаптивно, максимизируя эффективность предсказаний комитета на обучающей выборке. В итоге лучшие сети будут вносить наибольший вклад, в то время как предсказания сетей, дающих худшие результаты, будут вносить меньший вклад и не будут портить предсказания.
ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ОЦЕНКИ И УПРАВЛЕНИЯ РИСКАМИ ПРЕДПРИЯТИЯ
Теория управления рисками (страхование и риск-менеджмент) применяется для определения источников потерь, изучением логики и вероятности возникновения событий риска, а также вырабатывает методы и решения для компенсации понесенных в результате убытков.
Главным инструментом управления рисками и убытками от них является хеджирование. Под хеджированием понимается динамическая стратегия управления объектом, подверженным воздействию рисков (стратегия хеджа), обеспечивающая с заданной степенью точности количественную оценку вероятности возникновения рискованной ситуации и ограничивающая в случае реализации риска размеры ожидаемых потерь до заданного уровня [23, с. 118 - 120]. Анализ развития математических методов и средств измерения и управления финансовыми рисками, применяемых ведущими мировыми корпорациями, показывает, что с начала 90-х гг. наблюдается массовое внедрение в практику статистических моделей оценки потерь от рыночного риска VAR (Value At Risk) [23, с. 45].
В настоящее время при компьютерном и математическом моделировании для описания неопределенностей чаще всего используют такие математические средства, как:
• вероятностно-статистические методы;
• методы статистики нечисловых данных, в том числе интервальной статистики и интервальной математики, а также методы теории нечеткости;
• методы теории конфликтов (теории игр);
• методы теории искусственного интеллекта (нейронные сети, генетические алгоритмы и т.д.)
Тем не менее, формальные методы оценки рисков во многих случаях не могут дать однозначных рекомендаций. Поэтому, наряду с формально-экономическими методами, обязательным является применение экспертных методов прогнозирования и соответствующих методов из теории экспертных оценок [9].
Ограниченность использования статистических моделей риска были осознаны во время кризиса 1998-99 гг., в результате которого рухнули несколько больших финансовых организаций, которые использовали статистические модели риска [20].
Перспективным методом для управления рисками считается применение аппарата нейронных сетей для систематизации и прогнозирования рисков.
Что бы управлять рисками можно использовать нейронные сети в следующих областях:
Оценка производственных рисков. Прогнозирование необходимого запаса сырья. Оптимальное планирование производства.
Оценка инвестиционных рисков. Анализ организационно-экономической устойчивости предприятий и прогнозирование банкротств.