# Предиктивная аналитика

# Описание прогнозной модели

Прогнозные модели и скрипты размещены на сервере `izb-ally-nodered02` (IP: 10.1.241.244).

Скрипты написаны на **Python** с использованием библиотеки **ENTA**

```shell
python3.10 main.py --help
Usage: main.py [OPTIONS] COMMAND [ARGS]...

Options:
  --help  Show this message and exit.

Commands:
  copy      copy time_series from one DB to another
  fit       Fits model with collected lines from DB
  forecast  Makes forecast for the next 7 days and saves it to DB
  test      Evaluates forecast metrics
  view      Prints one segment used for forecast

```

Наилучшие результаты при прогнозировании показала модель **CatBoost**.

Перед использованием модель необходимо обучить. После обучения она может применяться для построения прогноза.

Данные для обучения поступают из различных источников, а результаты прогнозов сохраняются в гипертаблицу `time_series`.

Для обучения используются погодные данные, которые ежедневно загружаются с сайта [rp5.ru](https://rp5.ru) в таблицы `weather` и `weather_stations`. Загрузка осуществляется с помощью скрипта `rp5_weather`, который настраивается через файл `static/cities.txt`. Этот файл содержит список метеостанций по всей стране.

В таблице `weather` также хранятся исторические данные о погоде, начиная с 2005 года.

Кроме исторических данных, для прогнозирования требуется актуальный прогноз погоды. Он ежедневно загружается с сайта [api.met.no](https://api.met.no) через **Node-RED** в таблицу `weather`.

Также в прогнозе используется данные табель календаря из таблицы calendar и календарь Православных Христианских праздников.

Также при построении прогноза учитываются данные производственного календаря из таблицы `calendar` и календаря православных праздников.

Попытка включить мусульманские праздники в расчёт прогноза не улучшила точность.

Прогноз может строиться на заданное количество дней вперёд и с различной степенью дискретизации.

# Работа с данными для прогнозов

Мы получаем исходные данные из базы данных MS SQL с помощью SQL-запросов.

---

### Получение данных о заказах

Для получения данных о заказах составляется отчет по заказам с фильтрацией по дате заказа и наличию даты поставки.

Источником получения данных служит таблица Report.\[report\_zakaz\_tbl\]

Запрос извлекает данные о заказах из таблицы отчетов за указанный период времени. Запрос фокусируется на заказах, где дата заказа находится в заданном диапазоне, и дата поставки не является NULL. Дополнительно вычисляется поле с датой поставки, увеличенной на 15 минут.

<details id="bkmrk-%D0%A2%D0%B5%D0%BA%D1%81%D1%82-%D0%B7%D0%B0%D0%BF%D1%80%D0%BE%D1%81%D0%B0-%D0%9D%D0%B8%D0%B6%D0%B5-%D0%BF"><summary>Текст запроса</summary>

Ниже представлен запрос для получения информации о заказах:

```
SELECT 
    id_order as id, 
    ShopNo as shopno, 
    order_type, 
    gettype, 
    date_order, 
    date_supply, 
    date_supply_untill, 
    date_posted, 
    date_collect_start, 
    date_collected, 
    date_delivery_start, 
    date_delivered, 
    sum_paid, 
    sum_paid_coupon, 
    count_pos, 
    latitude, 
    longitude, 
    client_type, 
    order_weight, 
    delivery_hottime, 
    collecting_await_dur, 
    collecting_dur, 
    delivery_await_dur, 
    delivery_dur, 
    completed_agg, 
    distance, 
    DATEADD(Minute, 15, date_supply) as date_supply_vv 
FROM Report.[report_zakaz_tbl] rzt (NOLOCK) 
WHERE date_order BETWEEN '{{payload.from}}' AND '{{payload.to}}' 
AND date_supply IS NOT NULL
```

</details><details id="bkmrk-%D0%9F%D0%BE%D0%BB%D1%8F-%D0%B7%D0%B0%D0%BF%D1%80%D0%BE%D1%81%D0%B0-%D0%97%D0%B0%D0%BF%D1%80%D0%BE%D1%81-"><summary>Поля запроса</summary>

Запрос возвращает 27 полей. Ниже приведена таблица с описаниями:

<table border="1" style="border-collapse: collapse; width: 100%; height: 833.11px;"><colgroup><col style="width: 33.3745%;"></col><col style="width: 27.6935%;"></col><col style="width: 39.0555%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Поле SELECT</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Исходное поле</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Тип данных</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">id</td><td style="height: 29.7969px;">id\_order</td><td style="height: 29.7969px;">INT</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">shopno</td><td style="height: 29.7969px;">ShopNo</td><td style="height: 29.7969px;">INT</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">order\_type</td><td style="height: 29.7969px;">order\_type</td><td style="height: 29.7969px;">TinyInt</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">gettype</td><td style="height: 29.7969px;">gettype</td><td style="height: 29.7969px;">TinyInt</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_order</td><td style="height: 29.7969px;">date\_order</td><td style="height: 29.7969px;">DateTime</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_supply</td><td style="height: 29.7969px;">date\_supply</td><td style="height: 29.7969px;">DateTime</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_supply\_untill</td><td style="height: 29.7969px;">date\_supply\_untill</td><td style="height: 29.7969px;">DateTime</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_posted</td><td style="height: 29.7969px;">date\_posted</td><td style="height: 29.7969px;">DateTime</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_collect\_start</td><td style="height: 29.7969px;">date\_collect\_start</td><td style="height: 29.7969px;">DateTime</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_collected</td><td style="height: 29.7969px;">date\_collected</td><td style="height: 29.7969px;">DateTime</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_delivery\_start</td><td style="height: 29.7969px;">date\_delivery\_start</td><td style="height: 29.7969px;">DateTime</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_delivered</td><td style="height: 29.7969px;">date\_delivered</td><td style="height: 29.7969px;">DateTime</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">sum\_paid</td><td style="height: 29.7969px;">sum\_paid</td><td style="height: 29.7969px;">FLOAT</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">sum\_paid\_coupon</td><td style="height: 29.7969px;">sum\_paid\_coupon</td><td style="height: 29.7969px;">FLOAT</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">count\_pos</td><td style="height: 29.7969px;">count\_pos</td><td style="height: 29.7969px;">SmallInt</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">latitude</td><td style="height: 29.7969px;">latitude</td><td style="height: 29.7969px;">Decimal(19,16)</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">longitude</td><td style="height: 29.7969px;">longitude</td><td style="height: 29.7969px;">Decimal(19,16)</td></tr><tr style="height: 28.5938px;"><td style="height: 28.5938px;">client\_type</td><td style="height: 28.5938px;">client\_type</td><td style="height: 28.5938px;">NVarChar(100) COLLATE Cyrillic\_General\_CI\_AS</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">order\_weight</td><td style="height: 29.7969px;">order\_weight</td><td style="height: 29.7969px;">Decimal(15,3)</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">delivery\_hottime</td><td style="height: 29.7969px;">delivery\_hottime</td><td style="height: 29.7969px;">DateTime</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">collecting\_await\_dur</td><td style="height: 29.7969px;">collecting\_await\_dur</td><td style="height: 29.7969px;">INT</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">collecting\_dur</td><td style="height: 29.7969px;">collecting\_dur</td><td style="height: 29.7969px;">INT</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">delivery\_await\_dur</td><td style="height: 29.7969px;">delivery\_await\_dur</td><td style="height: 29.7969px;">INT</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">delivery\_dur</td><td style="height: 29.7969px;">delivery\_dur</td><td style="height: 29.7969px;">INT</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">completed\_agg</td><td style="height: 29.7969px;">completed\_agg</td><td style="height: 29.7969px;">INT</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">distance</td><td style="height: 29.7969px;">distance</td><td style="height: 29.7969px;">Real</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_supply\_vv</td><td style="height: 29.7969px;">date\_supply</td><td style="height: 29.7969px;">(вычисляемое)</td></tr></tbody></table>

</details><details id="bkmrk-%D0%A4%D0%B8%D0%BB%D1%8C%D1%82%D1%80%D1%8B-%D0%B7%D0%B0%D0%BF%D1%80%D0%BE%D1%81%D0%B0-%D0%92-%D0%B7%D0%B0"><summary>Фильтры запроса</summary>

В запросе присутствуют 2 фильтра:

- date\_order BETWEEN '{{payload.from}}' AND '{{payload.to}}' — Фильтр по дате заказа. Включает заказы, где дата заказа &gt;= '{{payload.from}}' и &lt;= '{{payload.to}}'.
- date\_supply IS NOT NULL — Исключает заказы без указанной даты поставки.

</details><details id="bkmrk-%D0%92%D1%8B%D1%87%D0%B8%D1%81%D0%BB%D1%8F%D0%B5%D0%BC%D1%8B%D0%B5-%D0%BF%D0%BE%D0%BB%D1%8F-%D0%92-%D0%B7"><summary>Вычисляемые поля</summary>

В запросе есть вычисляемое поле:

- DATEADD(Minute, 15, date\_supply) as date\_supply\_vv — Функция SQL Server для добавления 15 минут к полю date\_supply.

</details>---

### Получение данных о геозонах

Для получения данных о геозонах составляется отчет по зонам с фильтрацией по магазинам.

Источником получения данных служит таблицы \[GeoReports\].\[Analytics\].\[EffectiveZonesOnlineServices\] и \[Geo\].\[geo\].\[tt\]

Запрос объединяет данные из двух таблиц для получения информации о зонах, услугах и временных интервалах.

<details id="bkmrk-%D0%A2%D0%B5%D0%BA%D1%81%D1%82-%D0%B7%D0%B0%D0%BF%D1%80%D0%BE%D1%81%D0%B0-%D0%9D%D0%B8%D0%B6%D0%B5-%D0%BF-1"><summary>Текст запроса</summary>

Ниже представлен запрос для получения информации о заказах:

```
SELECT 
    tt.N AS id_tt, 
    id_online_service, 
    id_poly, 
    date_add, 
    geo, 
    payway, 
    time_start, 
    time_end 
FROM [GeoReports].[Analytics].[EffectiveZonesOnlineServices] (NOLOCK) z
JOIN [Geo].[geo].[tt] tt ON tt.id_TT = z.id_tt
WHERE tt.name_TT LIKE '%ДС[_]%
```

</details><details id="bkmrk-%D0%9F%D0%BE%D0%BB%D1%8F-%D0%B7%D0%B0%D0%BF%D1%80%D0%BE%D1%81%D0%B0-%D0%97%D0%B0%D0%BF%D1%80%D0%BE%D1%81--1"><summary>Поля запроса</summary>

Запрос возвращает 8 полей. Ниже приведена таблица с описаниями:

<table border="1" style="border-collapse: collapse; width: 100%; height: 297.969px;"><colgroup><col style="width: 33.3333%;"></col><col style="width: 33.3333%;"></col><col style="width: 33.3333%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Поле SELECT</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Исходное поле</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Тип данных</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">id\_tt</td><td style="height: 29.7969px;">tt.N</td><td style="height: 29.7969px;">  
</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">id\_online\_service

</td><td style="height: 29.7969px;">id\_online\_service

</td><td style="height: 29.7969px;">  
</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">id\_poly

</td><td style="height: 29.7969px;">id\_poly

</td><td style="height: 29.7969px;">  
</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_add

</td><td style="height: 29.7969px;">date\_add

</td><td style="height: 29.7969px;">  
</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">geo

</td><td style="height: 29.7969px;">geo

</td><td style="height: 29.7969px;">  
</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">payway

</td><td style="height: 29.7969px;">payway

</td><td style="height: 29.7969px;">  
</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">time\_start

</td><td style="height: 29.7969px;">time\_start

</td><td style="height: 29.7969px;">  
</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">time\_end

</td><td style="height: 29.7969px;">time\_end

</td><td style="height: 29.7969px;"> </td></tr></tbody></table>

</details><details id="bkmrk-%D0%A4%D0%B8%D0%BB%D1%8C%D1%82%D1%80%D1%8B-%D0%B7%D0%B0%D0%BF%D1%80%D0%BE%D1%81%D0%B0-%D0%92-%D0%B7%D0%B0-1"><summary>Фильтры запроса</summary>

В запросе присутствуют 2 фильтра:

- INNER JOIN на tt.id\_TT = z.id\_tt — Это объединяет записи только если есть совпадение по идентификатору точки (id\_tt). Если в z нет соответствующей записи в tt, она не попадет в результат.
- WHERE tt.name\_TT like '%ДС\[\_\]%' — Фильтр по имени точки (магазина) в таблице tt.

</details>---

### Таблицы хранения полученных данных

Исходные данные, используемые для построения прогноза, размещены в следующих таблицах:

- vv\_orders\_ts — гипертаблица с информацией о заказах. Включает поля, заполняемые на основе исходной таблицы Report.\[report\_zakaz\_tbl\], а также ряд дополнительных полей.
- test\_vv\_points — географические зоны, связанные с торговыми точками (ТТ).
- weather — данные о погоде, загруженные из сервиса [https://api.met.no](https://api.met.no).
- weather\_stations — погодные станции с сервиса rp5.ru. Применялись для загрузки исторических метеоданных.
- calendar — табель-календарь, заполняемый посредством системы репликации.

Кроме того, на базе этих таблиц создаются материализованные представления:

- vv\_orders\_ts\_hash\_hourly — заказы в географической зоне за определенный час, исключая заказы с типом gettype = 6 (доставка через Яндекс).
- vv\_lines\_ts\_hash\_hourly — количество собранных строк для географической зоны за конкретный час.

Ниже приведено описание этих таблиц и представлений, в которым перечислены поля использующиеся для составления прогноза.

<details id="bkmrk-vv_orders_ts-%D0%9F%D0%BE%D0%BB%D0%B5%C2%A0-%D0%A2"><summary>vv\_orders\_ts</summary>

<table border="1" style="border-collapse: collapse; width: 100%; height: 923.704px;"><colgroup><col style="width: 50.0618%;"></col><col style="width: 50.0618%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Поле </td><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Тип данных</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">id</td><td style="height: 29.7969px;">int4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">shopno</td><td style="height: 29.7969px;">int4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">order\_type</td><td style="height: 29.7969px;">int4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">gettype</td><td style="height: 29.7969px;">int4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_order</td><td style="height: 29.7969px;">timestamp</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_supply</td><td style="height: 29.7969px;">timestamp</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_supply\_untill</td><td style="height: 29.7969px;">timestamp</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_posted</td><td style="height: 29.7969px;">timestamp</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_collect\_start</td><td style="height: 29.7969px;">timestamp</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_collected</td><td style="height: 29.7969px;">timestamp</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_delivery\_start</td><td style="height: 29.7969px;">timestamp</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_delivered</td><td style="height: 29.7969px;">timestamp</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">sum\_paid</td><td style="height: 29.7969px;">float8</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">sum\_paid\_coupon</td><td style="height: 29.7969px;">float8</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">count\_pos</td><td style="height: 29.7969px;">int2</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">latitude</td><td style="height: 29.7969px;">numeric(19, 16)</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">longitude</td><td style="height: 29.7969px;">numeric(19, 16)</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">client\_type</td><td style="height: 29.7969px;">varchar(100)</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">order\_weight</td><td style="height: 29.7969px;">numeric(15, 3)</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">delivery\_hottime</td><td style="height: 29.7969px;">timestamp</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">collecting\_await\_dur</td><td style="height: 29.7969px;">int4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">collecting\_dur</td><td style="height: 29.7969px;">int4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">delivery\_await\_dur</td><td style="height: 29.7969px;">int4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">delivery\_dur</td><td style="height: 29.7969px;">int4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">completed\_agg</td><td style="height: 29.7969px;">int4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">distance</td><td style="height: 29.7969px;">float4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date\_supply\_vv</td><td style="height: 29.7969px;">timestamp</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">details</td><td style="height: 29.7969px;">jsonb</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">tt\_id</td><td style="height: 29.7969px;">int4</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">geohash</td><td style="height: 29.7969px;">varchar(20)</td></tr></tbody></table>

</details><details id="bkmrk-test_vv_points-%D0%9F%D0%BE%D0%BB%D0%B5%C2%A0"><summary>test\_vv\_points</summary>

<table border="1" style="border-collapse: collapse; width: 100%; height: 115.188px;"><colgroup><col style="width: 24.0051%;"></col><col style="width: 25.303%;"></col><col style="width: 50.6919%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Поле </td><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Тип данных</td><td class="align-center" style="background-color: rgb(206, 212, 217);">Описание</td></tr><tr style="height: 25.7969px;"><td style="height: 25.7969px;">geohash</td><td style="height: 25.7969px;">varchar(20)</td><td>Геохэш области</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">tt\_id</td><td style="height: 29.7969px;">numeric</td><td>ИД иорговой точки</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">coeff</td><td style="height: 29.7969px;">int4</td><td>Вероятность того, что заказ в данной области попадет в данную ТТ. Определяется на основе статистики заказов за предыдущие 3 дня

</td></tr></tbody></table>

</details><details id="bkmrk-weather-%D0%9F%D0%BE%D0%BB%D0%B5%C2%A0-%D0%A2%D0%B8%D0%BF-%D0%B4%D0%B0"><summary>weather</summary>

<table border="1" style="border-collapse: collapse; width: 100%; height: 115.188px;"><colgroup><col style="width: 24.0051%;"></col><col style="width: 25.303%;"></col><col style="width: 50.6919%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Поле </td><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Тип данных</td><td class="align-center" style="background-color: rgb(206, 212, 217);">Описание</td></tr><tr style="height: 25.7969px;"><td style="height: 25.7969px;">weather\_station\_id</td><td style="height: 25.7969px;">int4</td><td>ИД погодной станции</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date</td><td style="height: 29.7969px;">timestamp</td><td>Время</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">temperature</td><td style="height: 29.7969px;">numeric(3, 1)</td><td>Температура

</td></tr><tr><td>humidity</td><td>int4</td><td>Влажность

</td></tr><tr><td>wind\_speed</td><td>int4</td><td>Скорость ветра

</td></tr></tbody></table>

</details><details id="bkmrk-weather_stations-%D0%9F%D0%BE%D0%BB"><summary>weather\_stations</summary>

<table border="1" style="border-collapse: collapse; width: 100%; height: 115.188px;"><colgroup><col style="width: 24.0051%;"></col><col style="width: 25.303%;"></col><col style="width: 50.6919%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Поле </td><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Тип данных</td><td class="align-center" style="background-color: rgb(206, 212, 217);">Описание</td></tr><tr style="height: 25.7969px;"><td style="height: 25.7969px;">id</td><td style="height: 25.7969px;">serial4</td><td>ИД погодной станции</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">active</td><td style="height: 29.7969px;">bool</td><td>Признак активности</td></tr></tbody></table>

</details><details id="bkmrk-calendar-%D0%9F%D0%BE%D0%BB%D0%B5%C2%A0-%D0%A2%D0%B8%D0%BF-%D0%B4"><summary>calendar</summary>

<table border="1" style="border-collapse: collapse; width: 100%; height: 119.188px;"><colgroup><col style="width: 24.0051%;"></col><col style="width: 25.303%;"></col><col style="width: 50.6919%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Поле </td><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Тип данных</td><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Описание</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">id</td><td style="height: 29.7969px;">serial4</td><td style="height: 29.7969px;">ИД</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date</td><td style="height: 29.7969px;">date</td><td style="height: 29.7969px;">Дата</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">type</td><td style="height: 29.7969px;">int4</td><td style="height: 29.7969px;">Тип (2 - суббота, 3 - воскресенье, 4 - предпраздничный день, 5 - праздник)</td></tr></tbody></table>

</details><details id="bkmrk-vv_orders_ts_hash_ho-1"><summary>vv\_orders\_ts\_hash\_hourly</summary>

Для составления представления формируется запрос который формирует представление для хранения агрегированных данных о количестве заказов, сгруппированных по геохешу и часовым интервалам. Исключаются заказы с типом получения gettype = 6. Представление обновляется автоматически.

Источником получения данных служит таблица vv\_orders\_ts.

Текст запроса:

```
CREATE MATERIALIZED VIEW vv_orders_ts_hash_hourly 
WITH (timescaledb.continuous) AS 
SELECT 
    geohash, 
    time_bucket('1 hour', ts.date_supply_vv) AS bucket, 
    COUNT(*) AS cnt 
FROM vv_orders_ts ts 
WHERE ts.gettype != 6 
GROUP BY geohash, bucket;
```

Поля запроса:

<table border="1" style="border-collapse: collapse; width: 100%; height: 119.188px;"><colgroup><col style="width: 33.3333%;"></col><col style="width: 33.3333%;"></col><col style="width: 33.3333%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Поле</td><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Тип данных</td><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Описание</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">geohash</td><td style="height: 29.7969px;">varchar(20)</td><td style="height: 29.7969px;">  
</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">bucket</td><td style="height: 29.7969px;">timestamp</td><td style="height: 29.7969px;"> </td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">cnt</td><td style="height: 29.7969px;">int8</td><td style="height: 29.7969px;">  
</td></tr></tbody></table>

</details><details id="bkmrk-vv_lines_ts_hash_hou"><summary>vv\_lines\_ts\_hash\_hourly</summary>

Для составления представления формируется запрос который формирует представление для хранения агрегированных данных о суммарном количестве позиций (строк) в заказах, сгруппированных по геохешу и часовым интервалам.

Источником получения данных служит таблица vv\_orders\_ts.

Текст запроса:

```
CREATE MATERIALIZED VIEW vv_lines_ts_hash_hourly 
WITH (timescaledb.continuous) AS 
SELECT 
    geohash, 
    time_bucket('1 hour', ts.date_supply_vv) AS bucket, 
    SUM(ts.count_pos) AS cnt 
FROM vv_orders_ts ts 
GROUP BY geohash, bucket;
```

Поля запроса:

<table border="1" style="border-collapse: collapse; width: 100%; height: 119.188px;"><colgroup><col style="width: 33.3333%;"></col><col style="width: 33.3333%;"></col><col style="width: 33.3333%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Поле</td><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Тип данных</td><td class="align-center" style="background-color: rgb(206, 212, 217); height: 29.7969px;">Описание</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">geohash</td><td style="height: 29.7969px;">varchar(20)</td><td style="height: 29.7969px;">  
</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">bucket</td><td style="height: 29.7969px;">timestamp</td><td style="height: 29.7969px;"> </td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">cnt</td><td style="height: 29.7969px;">int8</td><td style="height: 29.7969px;"> </td></tr></tbody></table>

</details>---

### Хранение результатов обработки исходных данных

Данные для прогнозов, сами прогнозы и результаты их анализа хранятся во временных рядах в таблице time\_series:

<table border="1" id="bkmrk-%D0%9F%D0%BE%D0%BB%D0%B5-%D0%A2%D0%B8%D0%BF-%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85-%D0%9E%D0%BF%D0%B8%D1%81" style="border-collapse: collapse; width: 100%;"><colgroup><col style="width: 33.3333%;"></col><col style="width: 33.3333%;"></col><col style="width: 33.3333%;"></col></colgroup><tbody><tr><td class="align-center" style="background-color: rgb(206, 212, 217);">Поле</td><td class="align-center" style="background-color: rgb(206, 212, 217);">Тип данных</td><td class="align-center" style="background-color: rgb(206, 212, 217);">Описание</td></tr><tr><td>id</td><td>bigserial</td><td>  
</td></tr><tr><td>tstamp</td><td>timestamptz</td><td> </td></tr><tr><td>type</td><td>int4</td><td>Описывает тип данных</td></tr><tr><td>restaurant\_id</td><td>int4</td><td>  
</td></tr><tr><td>user\_id</td><td>int4</td><td>  
</td></tr><tr><td>value</td><td>float8</td><td>Значение прогноза</td></tr><tr><td>details</td><td>jsonb</td><td> </td></tr></tbody></table>

Тип прогноза, для которого сформирован результат обработки, определяется значением поля type. Возможные числовые значения поля и их интерпретация приведены ниже. Сформированный прогноз по часам помещается в таблицу под типами 4-7

<table border="1" id="bkmrk-id-%D0%9E%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5-%D0%9F%D0%BE%D0%B4%D1%80%D0%B0%D0%B7%D0%B4%D0%B5" style="border-collapse: collapse; width: 100%; height: 515.532px;"><colgroup><col style="width: 5.93523%;"></col><col style="width: 34.1142%;"></col><col style="width: 20.0247%;"></col><col style="width: 20.0247%;"></col><col style="width: 20.0247%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);"><span style="color: rgb(0, 0, 0);">type</span></td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);"><span style="color: rgb(0, 0, 0);">Описание</span></td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);"><span style="color: rgb(0, 0, 0);">Подразделение</span></td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);"><span style="color: rgb(0, 0, 0);">Тип</span></td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);"><span style="color: rgb(0, 0, 0);">Источник</span></td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">1</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Данные по доставке</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Последняя миля</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Исходные данные</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Репликатор</span></td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">2</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Данные по сборке</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Последняя миля</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Исходные данные</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Репликатор</span></td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">4</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Прогноз доставка</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Последняя миля</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Прогноз</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Python</span></td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">5</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Прогноз сборка</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Последняя миля</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Прогноз</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Python</span></td></tr><tr style="height: 30.5938px;"><td style="height: 30.5938px;"><span style="color: rgb(0, 0, 0);">6</span></td><td style="height: 30.5938px;"><span style="color: rgb(0, 0, 0);">Прогноз по геозонам доставка</span></td><td style="height: 30.5938px;"><span style="color: rgb(0, 0, 0);">Последняя миля</span></td><td style="height: 30.5938px;"><span style="color: rgb(0, 0, 0);">Прогноз</span></td><td style="height: 30.5938px;"><span style="color: rgb(0, 0, 0);">Python</span></td></tr><tr style="height: 31.5938px;"><td style="height: 31.5938px;"><span style="color: rgb(0, 0, 0);">7</span></td><td style="height: 31.5938px;"><span style="color: rgb(0, 0, 0);">Прогноз по геозонам сборка</span></td><td style="height: 31.5938px;"><span style="color: rgb(0, 0, 0);">Последняя миля</span></td><td style="height: 31.5938px;"><span style="color: rgb(0, 0, 0);">Прогноз</span></td><td style="height: 31.5938px;"><span style="color: rgb(0, 0, 0);">Python</span></td></tr><tr style="height: 31.5938px;"><td style="height: 31.5938px;"><span style="color: rgb(0, 0, 0);">51</span></td><td style="height: 31.5938px;"><span style="color: rgb(0, 0, 0);">Оценка трудоемкости розница</span></td><td style="height: 31.5938px;"><span style="color: rgb(0, 0, 0);">Розница</span></td><td style="height: 31.5938px;"><span style="color: rgb(0, 0, 0);">Исходные данные</span></td><td style="height: 31.5938px;"><span style="color: rgb(0, 0, 0);">Node-RED</span></td></tr><tr style="height: 46.5938px;"><td style="height: 46.5938px;"><span style="color: rgb(0, 0, 0);">52</span></td><td style="height: 46.5938px;"><span style="color: rgb(0, 0, 0);">Прогноз суммарной трудоемкости Розница</span></td><td style="height: 46.5938px;"><span style="color: rgb(0, 0, 0);">Розница</span></td><td style="height: 46.5938px;"><span style="color: rgb(0, 0, 0);">Прогноз</span></td><td style="height: 46.5938px;"><span style="color: rgb(0, 0, 0);">Python</span></td></tr><tr style="height: 46.5938px;"><td style="height: 46.5938px;"><span style="color: rgb(0, 0, 0);">53</span></td><td style="height: 46.5938px;"><span style="color: rgb(0, 0, 0);">Прогноз трудоемкости кассиров Розница</span></td><td style="height: 46.5938px;"><span style="color: rgb(0, 0, 0);">Розница</span></td><td style="height: 46.5938px;"><span style="color: rgb(0, 0, 0);">Прогноз</span></td><td style="height: 46.5938px;"><span style="color: rgb(0, 0, 0);">Python</span></td></tr><tr style="height: 30.5938px;"><td style="height: 30.5938px;"><span style="color: rgb(0, 0, 0);">55</span></td><td style="height: 30.5938px;"><span style="color: rgb(0, 0, 0);">Факт суммарной выработки Розница</span></td><td style="height: 30.5938px;"><span style="color: rgb(0, 0, 0);">Розница</span></td><td style="height: 30.5938px;"><span style="color: rgb(0, 0, 0);">Аналитика</span></td><td style="height: 30.5938px;"><span style="color: rgb(0, 0, 0);">pgAgent</span></td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">56</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Факт выработки кассиров Розница</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Розница</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Аналитика</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">pgAgent</span></td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">154</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Курьеры факт</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Последняя миля</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Аналитика</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Node-RED</span></td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">155</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Курьеры план</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Последняя миля</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Аналитика</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Node-RED</span></td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">156</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Курьеры прогноз</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Последняя миля</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Аналитика</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Node-RED</span></td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">157</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Заказы план</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Последняя миля</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Аналитика</span></td><td style="height: 29.7969px;"><span style="color: rgb(0, 0, 0);">Node-RED</span></td></tr></tbody></table>

# Запросы для составления прогнозов

Данные о доставке и сборке используются в качестве основного прогнозируемого ряда, в то время как остальные в качестве регрессионных данных.

---

### Зональный прогноз доставки

Для зонального прогноза доставки извлекаются и агрегируются данные рассчитываемые как сумма количества заказов (cnt), умноженного на коэффициент из геоточки (coeff), сгруппированных по идентификатору торговой точки (tt\_id) и часовому интервалу (bucket).

Ниже представлен запрос который делает все это и объединяет данные о заказах с географическими точками для анализа по сегментам (торговым точкам или зонам) в заданном диапазоне дат:

```
SELECT 
    h.bucket AS timestamp, 
    vp.tt_id AS segment, 
    SUM(cnt * coeff) AS target 
FROM vv_orders_ts_hash_hourly h 
JOIN test_vv_points vp ON vp.geohash = h.geohash 
WHERE bucket BETWEEN '{from_date}' AND '{to_date}' 
GROUP BY vp.tt_id, h.bucket;
```

Запрос берет значения из:

- vv\_orders\_ts\_hash\_hourly — представление которое содержит агрегированные данные о количестве заказов по геохешу и часам.
- test\_vv\_points — таблица, содержащая географические зоны, связанные с торговыми точками.

Запрос формирует следующие поля:

<table border="1" id="bkmrk-%D0%9F%D0%BE%D0%BB%D0%B5-%D0%B2-select-%D0%98%D1%81%D1%85%D0%BE%D0%B4%D0%BD" style="border-collapse: collapse; width: 100%; height: 208.578px;"><colgroup><col style="width: 14.8331%;"></col><col style="width: 16.2368%;"></col><col style="width: 68.9301%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Поле в SELECT</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Исходное поле</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Описание</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">timestamp</td><td style="height: 29.7969px;">h.bucket</td><td style="height: 29.7969px;">Временной интервал, начало часа для агрегации данных о заказах.</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">segment</td><td style="height: 29.7969px;">vp.tt\_id</td><td style="height: 29.7969px;">Идентификатор торговой точки, к которой привязан geohash.</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">target</td><td style="height: 29.7969px;">(Вычисляемое)</td><td style="height: 29.7969px;">Сумма (cnt \* coeff), где cnt — количество заказов, coeff — коэффициент из геоточки.</td></tr></tbody></table>

---

### Зональный прогноз сборки

Для зонального прогноза сборки извлекаются и агрегируются данные рассчитываемые как сумма количества строк в заказах (cnt), умноженного на коэффициент (coeff), сгруппированных по идентификатору торговой точки (tt\_id) и часовому интервалу (bucket).

Ниже представлен запрос который который делает все это и объединяет данные о строках заказов с географическими точками для зонального анализа в заданном диапазоне дат.

```
SELECT 
    h.bucket AS timestamp, 
    vp.tt_id AS segment, 
    SUM(cnt * coeff) AS target 
FROM vv_lines_ts_hash_hourly h 
JOIN test_vv_points vp ON vp.geohash = h.geohash 
WHERE bucket BETWEEN '{from_date}' AND '{to_date}' 
GROUP BY vp.tt_id, h.bucket;
```

Запрос берет значения из:

- vv\_lines\_ts\_hash\_hourly — представление которое содержит агрегированные данные о количестве заказов по геохешу и часам.
- test\_vv\_points — таблица, содержащая географические зоны, связанные с торговыми точками.

Запрос формирует следующие поля:

<table border="1" id="bkmrk-%D0%9F%D0%BE%D0%BB%D0%B5-%D0%B2-select-%D0%98%D1%81%D1%85%D0%BE%D0%B4%D0%BD-1" style="border-collapse: collapse; width: 100%; height: 208.578px;"><colgroup><col style="width: 14.8331%;"></col><col style="width: 16.2368%;"></col><col style="width: 68.9301%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Поле в SELECT</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Исходное поле</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Описание</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">timestamp</td><td style="height: 29.7969px;">h.bucket</td><td style="height: 29.7969px;">Временной интервал, начало часа для агрегации данных о заказах.</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">segment</td><td style="height: 29.7969px;">vp.tt\_id</td><td style="height: 29.7969px;">Идентификатор торговой точки, к которой привязан geohash.</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">target</td><td style="height: 29.7969px;">(Вычисляемое)</td><td style="height: 29.7969px;">Сумма (cnt \* coeff), где cnt — количество строк в заказах, coeff — коэффициент из геоточки.</td></tr></tbody></table>

---

### Данные о погоде

В прогнозах используются данные о погоде, такие как температура, влажность и скорость ветра из активных погодных станций в заданном диапазоне дат.

Ниже представлен запрос данных о погоде с дополнением последними значениями на конечную дату.

```
WITH t AS (
    SELECT 
        w.weather_station_id AS station_id, 
        w.date, 
        w.temperature, 
        w.humidity, 
        w.wind_speed, 
        ROW_NUMBER() OVER (PARTITION BY w.weather_station_id ORDER BY w.date DESC) AS rn 
    FROM weather w 
    JOIN weather_stations st ON st.id = w.weather_station_id 
    WHERE st.active AND date BETWEEN '{from_date}' AND '{to_date}'
)
SELECT 
    station_id, 
    date, 
    temperature, 
    humidity, 
    wind_speed 
FROM t 
UNION 
SELECT 
    station_id, 
    '{to_date}', 
    temperature, 
    humidity, 
    wind_speed 
FROM t 
WHERE t.rn = 1 
ORDER BY station_id, date;
```

Запрос берет значения из:

- weather — содержит исторические данные о погоде по станциям и датам.
- weather\_stations — содержит информацию о погодных станциях.

Запрос формирует следующие поля:

<table border="1" id="bkmrk-%D0%9F%D0%BE%D0%BB%D0%B5-%D0%B2-select-%D0%98%D1%81%D1%85%D0%BE%D0%B4%D0%BD-2" style="border-collapse: collapse; width: 100%; height: 255.172px;"><colgroup><col style="width: 13.9679%;"></col><col style="width: 18.0458%;"></col><col style="width: 67.9864%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Поле в SELECT</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Исходное поле</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Описание</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">station\_id</td><td style="height: 29.7969px;">w.weather\_station\_id</td><td style="height: 29.7969px;">Идентификатор погодной станции.</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date</td><td style="height: 29.7969px;">w.date</td><td style="height: 29.7969px;">Дата измерения погоды.</td></tr><tr style="height: 46.5938px;"><td style="height: 46.5938px;">temperature</td><td style="height: 46.5938px;">w.temperature</td><td style="height: 46.5938px;">Температура</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">humidity</td><td style="height: 29.7969px;">w.humidity</td><td style="height: 29.7969px;">Влажность воздуха</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">wind\_speed</td><td style="height: 29.7969px;">w.wind\_speed</td><td style="height: 29.7969px;">Скорость ветра</td></tr></tbody></table>

На основе метеорологических данных рассчитывается эквивалентная температура, которая используется в качестве входных данных для регрессионного анализа.

```
37 - (37 - temperature) / (0.68 - 0.0014 * humidity] + 1 / (1.76 + 1.4 * pow(wind_speed, 0.75))) - 0.29 * temperature * (1 - humidity / 100)
```

В этой формуле:

- Вычисляется разница между 37°C и фактической температурой: (37 - temperature). Это базовый "дефицит тепла".
- Вычисляется фактор сопротивления: (0.68 - 0.0014 \* humidity + 1 / (1.76 + 1.4 \* pow(wind\_speed, 0.75))). Он увеличивается при высокой влажности (меньше охлаждения) и уменьшается при сильном ветре (больше охлаждения).
- Делится разница на фактор сопротивления и вычитается из 37: это даёт основную ощущаемую температуру с учетом конвекции.
- Вычитается корректировка на испарение: 0.29 \* temperature \* (1 - humidity / 100), которая дополнительно охлаждает в сухих условиях.

---

### Календарные данные

В прогнозах используются данные производственного календаря из таблицы и календарь Православных Христианских праздников.

Ниже представлен запрос календарных данных:

```
SELECT 
    date, 
    type AS holiday 
FROM calendar 
WHERE date BETWEEN '{from_date}' AND '{to_date}' 
ORDER BY date;
```

Запрос берет значения из:

- calendar — табель-календарь, заполняемый через систему репликации

Запрос формирует следующие поля:

<table border="1" id="bkmrk-%D0%9F%D0%BE%D0%BB%D0%B5-%D0%B2-select-%D0%98%D1%81%D1%85%D0%BE%D0%B4%D0%BD-3" style="border-collapse: collapse; width: 100%; height: 255.172px;"><colgroup><col style="width: 13.9679%;"></col><col style="width: 18.0458%;"></col><col style="width: 67.9864%;"></col></colgroup><tbody><tr style="height: 29.7969px;"><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Поле в SELECT</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Исходное поле</td><td class="align-center" style="height: 29.7969px; background-color: rgb(206, 212, 217);">Описание</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">date</td><td style="height: 29.7969px;">date</td><td style="height: 29.7969px;">Дата календарного события

</td></tr><tr style="height: 29.7969px;"><td style="height: 29.7969px;">holiday

</td><td style="height: 29.7969px;">type

</td><td style="height: 29.7969px;">Тип события</td></tr></tbody></table>

Данные о православных праздниках хранятся в файле: [calendar.csv](https://bookstack.ally.software/attachments/40)

# Логика прогнозов

### <span style="color: rgb(0, 0, 0);">Прогноз для последней мили:</span>

<span style="color: rgb(0, 0, 0);">Прогнозы по сборке и доставке строятся с шагом 1 час и охватывают период в 14 дней вперёд.</span>

##### <span style="color: rgb(0, 0, 0);">Обычный прогноз.</span>

<span style="color: rgb(0, 0, 0);">Основан на данных о сборке и доставке, где каждый заказ привязан к ТТ.</span>

<span style="color: rgb(0, 0, 0);">Данные загружаются в БД Ally из БД MS SQL через **Node-RED**.</span>

##### <span style="color: rgb(0, 0, 0);">Зональный прогноз.</span>

<span style="color: rgb(0, 0, 0);">Основан на данных о сборке и доставке, где каждый заказ привязан к ТТ, и на статистике распределения адресов по зонам той или иной ТТ.</span>

<span style="color: rgb(0, 0, 0);">На основе геозон ТТ формируются сводные буферы, по которым рассчитываются вероятности выполнения заказов конкретной ТТ, исходя из статистики за последние 7 дней.</span>

<span style="color: rgb(0, 0, 0);">Вся история заказов автоматически сопоставляется с текущими геозонами, что позволяет обучать модель так, как будто эти зоны всегда были такими. Это также даёт возможность строить прогнозы для новых ТТ с недостаточной историей данных.</span>

---

### <span style="color: rgb(0, 0, 0);">Прогноз для розницы</span>

<span style="color: rgb(0, 0, 0);">Прогноз по трудоёмкости строится с шагом 1 день и охватывает 21 день вперёд.</span>

<span style="color: rgb(0, 0, 0);">Основан на оценке трудоёмкости, которая загружается во временной ряд 51 через **Node-RED**.</span>

---

### Расчёт требуемого количества сборщиков

Прогноз трудоёмкости сборщиков автоматически пересчитывается в требуемое количество сборщиков. Расчёт выполняется по следующему алгоритму:

1. **Оценка скорости сборки сотрудников**  
    Для каждого сотрудника рассчитывается средняя скорость сборки на основе фактических данных за последний месяц. Скорость выражается в количестве строк, которые сотрудник собирает в час.
2. **Расчёт плановой производительности**  
    Для каждого часа прогнозируемого периода рассчитывается ожидаемое количество собранных строк на основе списка запланированных сборщиков и их индивидуальной скорости работы.
3. **Сравнение с прогнозом**  
    Вычисляется разность между прогнозируемым количеством строк на сборку и плановой производительностью сборщиков.
4. **Корректировка численности**  
    Разность преобразуется в дополнительное или избыточное количество сотрудников. Для этого используется средняя скорость сборки по всем сборщикам на данной торговой точке.
5. **Вывод итогового количества**  
    Полученное число используется для формирования рекомендаций: сколько сотрудников необходимо добавить или убрать из смены в конкретный час.

Для подсчета скорости сборки заказов используется подход средней скорости сборки которая рассчитывается как количество собранных строк в течение одного часа (строки / час).

---

### Расчет требуемого количества курьеров

Прогноз по требуемому количеству курьеров можно описать формулой:

<span style="font-size: 12.0pt; line-height: 115%; font-family: 'Calibri',sans-serif; mso-ascii-theme-font: minor-latin; mso-fareast-font-family: Calibri; mso-fareast-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; mso-ansi-language: RU; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">![](https://bookstack.ally.software/uploads/images/gallery/2025-08/embedded-image-0kqglfmf.png)</span>

Где:

<span style="font-size: 12.0pt; line-height: 115%; font-family: 'Aptos',sans-serif; mso-ascii-theme-font: minor-latin; mso-fareast-font-family: Aptos; mso-fareast-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; mso-ansi-language: RU; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">t — Конкретный час, о котором идёт речь</span>

<span style="font-size: 12.0pt; line-height: 115%; font-family: 'Aptos',sans-serif; mso-ascii-theme-font: minor-latin; mso-fareast-font-family: Aptos; mso-fareast-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; mso-ansi-language: RU; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">Dt — Сколько заказов на доставку ожидается в этот час</span>

<span style="font-size: 12.0pt; line-height: 115%; font-family: 'Aptos',sans-serif; mso-ascii-theme-font: minor-latin; mso-fareast-font-family: Aptos; mso-fareast-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; mso-ansi-language: RU; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">Nt — Сколько людей уже поставили смену на этот час</span>

**![](https://bookstack.ally.software/uploads/images/gallery/2025-08/embedded-image-im2x2hgz.png)** — <span style="font-size: 12.0pt; line-height: 115%; font-family: 'Aptos',sans-serif; mso-ascii-theme-font: minor-latin; mso-fareast-font-family: Aptos; mso-fareast-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; mso-ansi-language: RU; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">Средняя скорость работы i-го человека, записавшегося в смену</span>

![](https://bookstack.ally.software/uploads/images/gallery/2025-08/embedded-image-qbkb5ame.png)— <span style="font-size: 12.0pt; line-height: 115%; font-family: 'Aptos',sans-serif; mso-ascii-theme-font: minor-latin; mso-fareast-font-family: Aptos; mso-fareast-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; mso-ansi-language: RU; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">Средняя скорость по всем курьерам на точке</span>

<span style="font-size: 12.0pt; line-height: 115%; font-family: 'Aptos',sans-serif; mso-ascii-theme-font: minor-latin; mso-fareast-font-family: Aptos; mso-fareast-theme-font: minor-latin; mso-hansi-theme-font: minor-latin; mso-bidi-font-family: 'Times New Roman'; mso-bidi-theme-font: minor-bidi; mso-ansi-language: RU; mso-fareast-language: EN-US; mso-bidi-language: AR-SA;">Rt — Сколько работников нужно вывести в итоге в этот час</span>