Визуальное сравнениеИщем визуальное сходство между товарами
Еще на этапе обучения для каждого изображения товара создается уникальный цифровой отпечаток (эмбеддинг), - так система запоминает, чем товары отличаются друг от друга.
Все эти эмбеддинги хранятся в специальной векторной базе данных, и организованы так, что отпечатки похожих товаров находятся рядом, а непохожие далеко.
Так, например, майонез “Слобода” 400 мл и 800 мл будут находиться близко. А майонез “Слобода” 400 мл и майонез “Mr. Ricco” 400 мл будут находиться дальше. И любой майонез находится далеко от банки колы.
Когда на обработку системе приходит новое изображение, детектор выделяет на нем фрагмент с товаром. После чего система присваивает ему эмбеддинг, а затем ищет максимально близкие ему эмбеддинги в векторном хранилище.
Начинается сравнение с числовой библиотекой товаров: какой из них ближе всего к нашему товару?
Система выбирает отпечатки, которые ближе всего, к нашему и выбирает самый близкий. Затем смотрит, какому товару принадлежит этот отпечаток. С очень большой вероятностью, это и есть товар, изображенный на новом фото.
Этот подход решает около 85% задач. Но иногда система путает похожие между собой товары: например, разные вкусы или форматы одной и той же марки. Поэтому мы дополняем ее другими алгоритмами для улучшения точности предсказаний.