Комплексная система анализа изображений на основе технологии компьютерного зрения:
Поиск похожих изображений по собственной базе зарегистрированных товарных знаков с учётом класса по Международной классификации товаров и услуг (МКТУ).
Задача
«Гардиум» — патентно-адвокатское бюро
Клиент
алгоритм для анализа и разметки изображений в базе клиента
фильтр изображений для распределения по классам МКТУ
нейросеть для поиска похожих изображений
Сервис помогает избегать судебных споров об интеллектуальных правах, а также бороться с плагиатом и патентными троллями.
01/
Нейросеть ищет похожие изображения среди тех, что отобрал алгоритм
«Гардиум» оценивает уникальность торгового знака, начинает регистрацию
Как это работает
Алгоритм отбирает изображения в базе с учётом указанного класса
«Гардиум» загружает изображение в поиск, указывает класс МКТУ
Компания просит «Гардиум» зарегистрировать торговый знак: отправляет фото или PDF-файл
Детали
02/
При поиске похожих изображений нейросеть учитывает цвета, формы, второстепенные элементы (например, фон) и другие признаки. В топе выдачи отображаются изображения с наибольшим количеством совпадающих признаков.
03/
Трудности проекта
Проблема
Решение
Отсутствие размеченных данных для обучения и тестирования нейросети.
Алгоритм, который самостоятельно классифицирует изображения. Используя его разметку, мы обучили нейросеть.
Шаг 01
Разведка данных (разметка изображений в базе клиента для будущего поиска)
Шаг 02
Проверка гипотез о поиске, подбор эффективных компьютерных моделей
Шаг 03
Обучение нейросети на размеченных алгоритмом данных
Шаг 04
Внедрение классификатора для распределения изображений по классам
Шаг 05
Тестирование сервиса внутри EORA и на стороне клиента
Шаг 06
Разработка, интеграция сервиса с базой клиента через API
Этапы разработки
04/
05/
Примеры работы системы
Команда проекта
06/
Алексей Гучко
Проектный менеджер
Data scientist
Вячеслав Шульц
Тимлид
Владислав Виноградов
Иван Измайлов
Бэкенд-разработчик
Алексей Гучко
Руководитель проекта
Цитата
07/
«У нас не было предварительно размеченных данных, которые помогли бы нейросети понимать, какие варианты выдачи правильные, а какие нет. Для тренировки нейросети мы использовали метод обучения "без учителя". Результат превзошел ожидания. Точность поиска оказалась очень высокой, клиент остался доволен»
Сроки разработки
08/
3 месяца
сентябрь – ноябрь 2021 года
Технологии
09/
EORA Mage
Адаптируемая система поиска товаров по фотографиям