Нейросетевой поиск похожих товарных знаков «Гардиум»

Компьютерное зрение

Комплексная система анализа изображений на основе технологии компьютерного зрения:
Решение
Задача
Поиск похожих изображений по собственной базе зарегистрированных товарных знаков с учётом класса по Международной классификации товаров и услуг (МКТУ).
Клиент
«Гардиум» — патентно-адвокатское бюро
нейросеть для поиска похожих изображений
фильтр изображений для распределения по классам МКТУ
алгоритм для анализа и разметки изображений в базе клиента
Сервис помогает избегать судебных споров об интеллектуальных правах, а также бороться с плагиатом и патентными троллями.
Как это работает
01/
Компания просит «Гардиум» зарегистрировать торговый знак: отправляет фото или PDF-файл
Нейросеть ищет похожие изображения среди тех, что отобрал алгоритм
«Гардиум» оценивает уникальность торгового знака, начинает регистрацию
Алгоритм отбирает изображения в базе с учётом указанного класса
«Гардиум» загружает изображение в поиск, указывает класс МКТУ

Детали

02/
При поиске похожих изображений нейросеть учитывает цвета, формы, второстепенные элементы (например, фон) и другие признаки. В топе выдачи отображаются изображения с наибольшим количеством совпадающих признаков.

Этапы разработки

03/
Разведка данных (разметка изображений в базе клиента для будущего поиска)
Шаг 01
Проверка гипотез о поиске, подбор эффективных компьютерных моделей
Шаг 02
Обучение нейросети на размеченных алгоритмом данных
Шаг 03
Внедрение классификатора для распределения изображений по классам
Шаг 04
Тестирование сервиса внутри EORA и на стороне клиента
Шаг 05
Разработка, интеграция сервиса с базой клиента через API
Шаг 06
Трудности проекта
04/
Проблема
Решение
Отсутствие размеченных данных для обучения и тестирования нейросети.
Алгоритм, который самостоятельно классифицирует изображения. Используя его разметку, мы обучили нейросеть.

В цифрах

05/
53%
точность поиска по базе изображений

Команда проекта

06/
Проектный менеджер
Алексей Гучко
Data scientist
Вячеслав Шульц
Тимлид
Владислав Виноградов
Иван Измайлов
Бэкенд-разработчик

Цитата

07/
«У нас не было предварительно размеченных данных, которые помогли бы нейросети понимать, какие варианты выдачи правильные, а какие нет. Для тренировки нейросети мы использовали метод обучения "без учителя". Результат превзошел ожидания. Точность поиска оказалась очень высокой, клиент остался доволен»
Руководитель проекта
Алексей Гучко

Сроки разработки

08/
3 месяца
сентябрь – ноябрь 2021 года

Технологии

08/
EORA Mage
Адаптируемая система поиска товаров по фотографиям

Планы

Добавить новый критерий поиска: по элементам изображений. Например поиск иллюстраций с буквой « ло», написанной конкретным шрифтом.
09/

Похожие проекты

10/
Чат-бот с компьютерным зрением для подбора обоев Leroy Merlin
INTELSONLINE – визуальный поиск похожих товарных знаков
KazanExpress – поиск товаров по фотографиям
«Фрисби». Нейросеть для распознавания показаний счетчиков
ISS – поиск посторонних предметов на днище автомобиля
Чат-бот для генерации роликов в стиле рекламы ESSA
Напишите нам