doi: 10.18698/2309-3684-2025-1-8091
В настоящей работе рассматривается реализация рекуррентной нейронной сети AT-LSTM (Attention based Long Short Term Memory) на языке программирования C++, разработанная с целью сокращения времени обучения и прямого хода модели. В статье представлены архитектура и примеры работы данной нейросети, описаны подходы к ее обучению и оценке результатов. В ходе исследования были проведены эксперименты по оценке производительности нейросети AT-LSTM при обучении и прямом ходе в сравнении с реализацией на языке Python. Оценка производительности включала измерение времени обучения и времени работы сети при одинаковой длине входных данных, но разных значениях гиперпараметров. Эксперименты показали возможность значительного сокращения времени обучения, снижения ошибки прогнозирования и сохранения высокого качества результатов прогноза при использовании реализации на языке программирования C++. Для того чтобы оценить применимость рассматриваемой реализации AT-LSTM на практике, был проведен анализ качества прогнозирования финансовых временных рядов. В качестве объектов анализа были выбраны курсы валют USD/RUB и EUR/RUB, а также курсы акций компаний Apple (AAPL) и Microsoft (MSFT). Результаты анализа показали, что полученная модель высокоэффективна для прогнозирования временных рядов и может быть успешно применена на практике. На основе проведенных экспериментов и анализа, установлено, что рассматриваемая реализация AT-LSTM на C++ позволяет быстро и качественно обучить модель для дальнейшего прогнозирования временных рядов.
[1] Макаренко А. В. Глубокие нейронные сети: зарождение, становление, современное состояние. Проблемы управления, 2020, № 2, c. 3–19.
[2] Лабусов М.В. Нейронные сети долгой краткосрочной памяти и их использование для моделирования финансовых временных рядов. Инновации и инвестиции, 2020, № 3, с. 167–171.
[3] Ширяев А.Н. Вероятностно-статистические модели эволюции финансовых индексов. Обозрение прикладной и промышленной математики. Москва, ТВП, 1995, Т. 2, № 4, с. 527–555.
[4] Булинский А.В., Ширяев А.Н. Теория случайных процессов. Москва, Физматлит, 2005, 408 с.
[5] Ширяев А.Н. Основы стохастической финансовой математики. Том 1. Факты. Модели. Москва, МЦНМО, 2016, 440 с.
[6] Ехлаков Р.С., Судаков В.А. Прогнозирование стоимости котировок при помощи LSTM и GRU сетей. Препринты ИПМ им. М.В. Келдыша, 2022, № 17, 13 с.
[7] Алжеев А.В., Кочкаров Р.А. Сравнительный анализ прогнозных моделей ARIMA и LSTM на примере акций российских компаний. Финансы: теория и практика, 2020, 24(1), с. 14–23.
[8] Облакова Т.В., Алексеев Д.С. Сравнительный анализ методов моделирования и прогнозирования временных рядов на основе теории фрактального броуновского движения. Математическое моделирование и численные методы, 2022, № 4, с. 48–62.
[9] As'ad Mohamad, Sujito Sujito, Setyowibowo Sigit. Neural Network Autoregressive For Predicting Daily Gold Price. Jurnal INFORM, 2020, vol. 5, no. 69, 10.25139/inform.v0i1.2715.
Облакова Т.В., Алексеев Д.С. Исследование качества прогнозирования временных рядов с помощью реализации модели AT-LSTM на C++. Математическое моделирование и численные методы, 2025, № 1, с. 80–91.
Количество скачиваний: 11