Моделирование Прогноза Прибыли Банковского Сектора РФ с Использованием Модели Случайный Лес и Регрессии

Экономика инженерных решений как часть устойчивого развития
Авторы:
Аннотация:

В условиях рыночной неопределенности предпринимается все больше попыток используя системы искусственного интеллекта сформировать точный прогноз величины прибыли банковского сектора. Научная новизна данного исследования заключается в получении прогнозов величины прибыли российского банковского сектора с использованием модели машинного обучения (ML-модель) «Случайный лес» и нейросетевой модели регрессии. Технологически обе модели объединены в «Когнитивную модель», поскольку выполнены в одном «облачном сервисе» Collab, имеют общий датасет – обучающее множество, скрипты и вывод результата. Целью исследования является формирование моделей (ML-модель «Случайный лес» и модель регрессии) для получения прогнозных значений прибыли отечественного банковского сектора и сравнения результатов работы этих моделей. В целях формирования датасета, используемого для обучения модели машинного обучения «Случайный лес» и модели регрессии, использовались данные, отражающие результаты деятельности российского банковского сектора, некоторые макроэкономические показатели отечественной экономики и биржевого рынка за период 2017–2021 гг. В частности, в датасет моделей были включены: Ключевая ставка (%), Прирост банковских активов (%), Доля просроченных кредитов (%), ВВП (млрд руб.), Индекс RTS (пунктов), Курс USD (руб.), Инвестиции в активы к ВВП (%), Доля роботов на бирже (%), Отток капитала (млрд. руб.), Банковские активы (трлн. руб.), Количество счетов на бирже (шт.), Прибыль банков (млрд. руб.). Практическая значимость исследования заключается в том, что результаты цифрового прогнозирования прибыли банковского сектора РФ могут быть рекомендованы для дальнейшего практического применения. При формировании когнитивной модели, использовался язык Python в облачной среде Collab. Средняя ошибка прогноза на тестовом множестве у ML-модели «Случайный лес» (DecisionTreeRegressor) составила 414,67 и на 61% оказалась ниже в сравнении с моделью линейной регрессии (LinearRegression), средняя ошибка которой составила 667,65.