001.891.573 Повышение эффективности обучения нейронных сетей для сегментации изображений

Валишин А. А. (МГТУ им.Н.Э.Баумана), Запривода А. В. (МГТУ им.Н.Э.Баумана), Цухло С. С. (МГТУ им.Н.Э.Баумана)

СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ, КОМПЬЮТЕРНОЕ ЗРЕНИЕ, СЕМАНТИЧЕСКАЯ СЕГМЕНТАЦИЯ, МАШИННОЕ ОБУЧЕНИЕ, АКТИВНОЕ ОБУЧЕНИЕ


doi: 10.18698/2309-3684-2025-3-103116


В данной статье критически анализируются современные подходы к повыше-нию эффективности обучения нейронных сетей для сегментации изображений. Под эффективностью обучения понимаются два взаимосвязанных аспекта: вычислительная эффективность и точность сегментации обученной модели. Особое внимание уделено трём способам повышения эффективности обуче-ния:1. применение методов аугментации. Аугментация – это процесс искус-ственного генерирования новых данных на основе существующих для обучения новых моделей. Этот метод позволяет увеличить размер и разнообразие набо-ра данных, что важно для улучшения обобщающей способности модели. В дан-ном случае аугментация включала в себя повороты изображения, наложение гауссовского шума, коррекция цветовой гаммы, 2. оптимизация архитектур нейронных сетей посредством интеграции эффективных энкодеров на базе EfficientNet, 3. применение методов активного обучения для выбора наиболее информативных обучающих примеров на основе вычисления энтропии выходных данных. Модели обучались с использованием оптимизатора Adam на задаче OpenEarthMap, где выборка составляла 20 % от исходного объёма, изображения уменьшались до разрешения 512×512 пикселей и дополнительно разбивались на 4 части размером 256×256 пикселей. Обучение проводилось на 9212 изображениях обучающей выборки и 1536 изображениях валидационной выборки в течение 100 циклов обучения. Результаты экспериментов показывают, что аугментация увеличивает точность сегментации модели UNet (IoU) с 36 % до 38,7 %, оптимизация архитектуры с использованием EfficientNet-b0 и b4 повышает IoU до 44,6 % и 45,3 % соответственно, а активное обучение, основанное на вычислении энтропии, демонстрирует потенциал выравнивания IoU по классам, хотя стабильность метрик остаётся проблематичной. Данная работа подчёркивает необходимость и перспективность комплексного подхода к оптимизации нейросетевых моделей для сегментации изображений и указывает направления для дальнейших исследований в области машинного обучения и повышения вычислительной эффективности.


[1] Ulku I., Akagunduz E. A survey on deep learning-based architectures for semantic segmentation on 2D images. Applied Artificial Intelligence, 2022, vol. 36, no. 1. DOI:10.1080/08839514.2022.203292
[2] Валишин А.А., Запривода А.В., Клонов А.С. Математическое моделирование и сравнительный анализ численных методов решения задачи непрерывно-дискретной фильтрации случайных процессов в реальном времени. Математическое моделирование и численные методы, 2024, № 1, с. 93-109.
[3] Достовалова А.М. Моделирование локально-однородных радиолокационных изображений при использовании различных статистических критериев. Математическое моделирование и численные методы, 2021, № 4, с. 103-120.
[4] Кутыркин В.А., Чалей М.Б. Стохастические модели кодирования и распо знавния структурно-статистических характеристик кодирующих последовательностей. Математическое моделирование и численные методы, 2017, № 3, с. 119-138
[5] Minaee S., Boykov Y., Porikli F., Plaza A., Kehtarnavaz N., Terzopoulos D. Image Segmentation Using Deep Learning: A Survey. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021, vol. 44, no. 7, pp. 3523-3542.
[6] Валишин А.А., Запривода А.В., Цухло С.С. Моделирование и сравнительный анализ эффективности перцептивных хеш-функций для поиска сегментированных изображений. Математическое моделирование и численные методы, 2024, № 2, с. 46-67.
[7] Ronneberger O., Fischer P., Brox T. U-Net: convolutional networks for bio-medical image segmentation. arXiv.org. [Электронный ресурс]. URL: https://arxiv.org/abs/1505.04597 (дата обращения: 05.06.2024).
[8] Tan M., Le Q. V. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks. arXiv.org. [Электронный ресурс]. URL: https://arxiv.org/abs/1905.11946 (дата обращения: 23.05.2024).
[9] Yan Q., Feng Y., Zhang C., Wang P., Wu P., Dong W., Sun J., Zhang Y. You only need one color space: an efficient network for low-light image en-hancement. arXiv.org. [Электронный ресурс]. URL: https://doi.org/10.48550/arXiv.2402.05809 (дата обращения: 12.05.2024).
[10] Lin T.-Yi, Goyal P., Girshick R., He K., Dollár P. Focal Loss for Dense Object Detection. Conference: 2017 IEEE International Conference on Computer Vision (ICCV), 2017. DOI:10.1109/ICCV.2017.324
[11] Kingma D.P., Ba J. Adam: A Method for Stochastic Optimization. arXiv.org. [Электронный ресурс]. URL: https://doi.org/10.48550/arXiv.1412.6980 (дата обращения: 11.06.2024).
[12] Xia J., Yokoya N., Adriano B., Broni-Bediako C. OpenEarthMap: A Bench-mark Dataset for Global High-Resolution Land Cover Mapping. arXiv.org. [Электронный ресурс]. URL: https://doi.org/10.48550/arXiv.2210.10732 (дата обращения: 24.05.2024).


Валишин А.А., Запривода А.В., Цухло С.С. Повышение эффективности обучения нейронных сетей для сегментации изображений. Математическое моделирование и численные методы, 2025, № 3, с. 103–116.



Скачать статью

Количество скачиваний: 2