doi: 10.18698/2309-3684-2024-4-111127
Работа посвящена сравнительному изучению параметрических и непараметрических методов обнаружения разладки во временных рядах различной природы. Для решения задачи обнаружения аномалии в рядах с неизвестными статистическими характеристиками рассмотрена и реализована модель на основе оценки расхождения Кульбака-Лейблера между законами распределения. Для вычисления параметров линейной модели применена процедура оценки значимости Кульбака-Лейблера (KLIEP). С помощью оригинального программного кода реализован двухэтапный алгоритм решения полученной задачи условной оптимизации методом градиентного спуска, для оценки обучающей способности модели использован метод кросс-валидации. Проведен сравнительный анализ качества обнаружения момента разладки рассмотренным методом KLIEP и классической моделью кумулятивных сумм (CUSUM). При работе с моделированными данными обнаружены незначительные вариации в таких характеристиках моделей KLIEP и CUSUM, как среднее время обнаружения момента разладки и уровень ложной тревоги. Для реальной задачи обнаружения сбоя в режиме энергопотребления обе процедуры продемонстрировали 1-2 ложных тревоги, однако в KLIEP получилось более узкое временное окно (5 временных интервалов против 20), что в принципе позволяет значительно быстрее и без потери точности определять аномалию. При обнаружении разладок в ключевых показателях эффективности интернет сервиса получены схожие результаты. В целом показано, что применение модели KLIEP не ухудшает качество определения момента возникновения аномалии в сравнении с популярными моделями, использующими статистические характеристики ряда. На реальных данных продемонстрировано преимущество использования данного подхода, поскольку он не требует знания закона распределения временного ряда.
[1] Aminikhanghahi S., Cook D. J. A survey of methods for time series change point detection. Knowledge and information systems, 2017, vol. 51, No. 2, pp. 339-367.
[2] Itoh N., Kurths J. Change-point detection of climate time series by nonparametric method. Proceedings of the world congress on engineering and computer science, 2010, vol. 1, pp. 445-448.
[3] Облакова Т.В., Касупович Э. Численное исследование персистентных временных рядов на основе модели ARFIMA. Математическое моделирование и численные методы, 2022, № 4, с. 114–125.
[4] Облакова Т.В., Алексеев Д.С. Сравнительный анализ методов моделирования и прогнозирования временных рядов на основе теории фрактального броуновского движения. Математическое моделирование и численные методы, 2022, № 4, с. 48–62
[5] Ширяев А. Стохастические задачи о разладке, Litres, 2022, 393 с.
[6] Спивак В. С., Тартаковский А. Г. Байесовский подход к наибыстрейшему обнаружению разладки в частично наблюдаемых марковских случайных процессах. Труды Московского физико-технического института, 2021, т. 13, № 2 (50), с. 161-170.
[7] Спивак В. С. Численное сравнение наиболее популярных быстрых процедур обнаружения разладки. Труды Московского физико-технического института, 2020, т. 12, № 2 (46), с. 88-98.
[8] Sugiyama M. et al. Direct importance estimation for covariate shift adaptation. Annals of the Institute of Statistical Mathematics, 2008, vol. 60, pp. 699-746.
[9] Kanamori T., Hido S., Sugiyama M. A least-squares approach to direct importance estimation. The Journal of Machine Learning Research, 2009, vol. 10, pp. 1391-1445.
[10] Liu S. et al. Change-point detection in time-series data by relative density-ratio estimation. Neural Networks, 2013, vol. 43, pp. 72-83.
[11] Desobry F., Davy M., Doncarli C. An online kernel change detection algorithm. IEEE Transactions on Signal Processing, 2005, vol. 53, No. 8, pp. 2961-2974.
[12] Chandola V., Vatsavai R. R. A gaussian process based online change detection algorithm for monitoring periodic time series. Proceedings of the Eleventh SIAM International Conference on Data Mining, 2011, pp. 95-106.
Облакова Т.В., Касупович Э. Имплементация процедуры Кульбака-Лейблера к задаче о разладке во временных рядах различной природы. Математическое моделирование и численные методы, 2024, № 4, с. 111–127.
Количество скачиваний: 13