Skip to main content

Описание прогнозной модели

Прогнозныеая модель используется для оценки заказов, трудоемкости и распределения ресурсов. Модели и скрипты размещены на сервере izb-ally-nodered02 (IP: 10.1.241.244).

Скрипты написаны на Python с использованием библиотеки ENTAENTA.


Скрипты и команды

python3.10 main.py --help
Usage: main.py [OPTIONS] COMMAND [ARGS]...

Options:
  --help  Show this message and exit.

Commands:
  copy      copy time_series from one DB to another
  fit       Fits model with collected lines from DB
  forecast  Makes forecast for the next 7 days and saves it to DB
  test      Evaluates forecast metrics
  view      Prints one segment used for forecast

Модель и обучение

Наилучшие результаты при прогнозировании показывалает модель CatBoost.

CatBoost.

Перед использованием модель необходимо обучить. После обучения она может применяеться для построения прогнозаов.

Данные для обучения поступают из различных источников, а результаты прогнозов сохраняются в гипертаблицу time_series.time_series.

Для


Истобученияки используютсяданных

п
  • Погодныа:
    • Исторические данные, к(с 2005 готорыеда) и ежедневные обновления загружаются с сайта rp5.ru в таблицы weather и weather_stations. Загрузка осуществляется с помощью скрипта rp5_weather, который (настраивается через файл static/cities.txt. Этот файл содержит спискокм метеостанций).
    • по всей стране.

      В таблице weather также хранятся исторические данные о погоде, начиная с 2005 года.

      Кроме исторических данных, для прогнозирования требуется а

    • Актуальный прогноз погоды. Он ежедневно загружается ежедневно с сайта api.met.no через Node-RED в таблицу weather.

      weather.
    • Также

    в
  • прогнозе используется данные табель календаря из таблицы calendar и к
  • Календарь: Православных Христианских праздников.

    Также при построении прогноза уУчитываются данные производственного календаря из таблицы calendar и календаря православных праздников.

    Попытка вВключенитье мусульманскиех праздники ов расчёт прогноза не улучшилао точность.

  • База данных ВкусВилл

Параметры прогноза

Прогноз может строиться на заданное количество дней вперёед и с различной степенью дискретизацией (шагом по времени).


Прогноз для последней мили:

Прогнозы по (сборкеа и доставкеа)

с

Строяится с шагом 1 час и охвнатывают период в 14 дней вперёед.

  • Обычный прогноз.
:

Основан на данных о сборке и доставке, где каждый заказы привязаны к торговой точке (ТТ).

Данные загружаются из MS SQL в БД Ally из БД MS SQL через Node-RED.

  • Node-RED.

    Зональный прогноз.
    :

    ОсноУчитыван нает данныхе о сборке и /доставке, где каждый заказ привязан к ТТ, и на статистикеу распределения адресов по геозонам той или иной ТТ.

    На основе геозон ТТ формируются сводные буферы, по которым рассчитываются вероятностями выполнения заказов к(на онкретсной ТТ, исходя изве статистики за последние 7 дней).

    Вся иИстория заказов автоматически сопоставляется с текущими геозонами для обучения модели, что позволяет обучать модель так, как будто эти зоны всегда были такими. Это также даёт возможность строить прогнозыировать для новых ТТ с ограничедостаточнной историей.

  • данных.


    Прогноз для розницы

    Прогноз по трудоёмкости сСтроится с шагом 1 день и охвнатывает 21 день вперёед.

    Основан на оценке трудоёемкости, которая загружаетсямой во временной ряд 51 через Node-RED.RED.