Создание таргетов (по данным разметки)
↓
Формирование признаков (реранкер, остатки, история)
↓
Обучение моделей CatBoost
↓
Валидация и оценка качества
Пример полки с разметкой таргетов в красных боксах товары которые впервые появились на этой полке
Примечание: Изначально мы пробовали определять новый товар на уровне магазина (первое появление товара в любом магазине сети), но такой подход показал худший результат. На практике оказалось эффективнее определять новые товары на уровне каждой конкретной полки, что мы и используем в таргете «новый товар на полке».
Пример фрагмента полки. Желтой рамкой выделена потенциальная ошибка реранкера (таргет bbox_label_modified = 1), когда модель ошиблась в классе товара и человек это исправил
Почему не бинарный таргет горячая/холодная разметка? Мы не стали объединять все изменения в один класс «горячих» разметок против «холодных», поскольку появление новых товаров и ошибки реранкера – разные по природе явления. Разделение на три отдельных таргета позволяет модели лучше учиться каждому случаю и применять разные метрики и пороги для разных сценариев.
Пример полки с разметкой таргетов в зеленых боксах холодные кропы