Комплексная система анализа изображений на основе технологии компьютерного зрения:
Решение
Задача
Поиск похожих изображений по собственной базе зарегистрированных товарных знаков с учётом класса по Международной классификации товаров и услуг (МКТУ).
Клиент
«Гардиум» — патентно-адвокатское бюро
нейросеть для поиска похожих изображений
фильтр изображений для распределения по классам МКТУ
алгоритм для анализа и разметки изображений в базе клиента
Сервис помогает избегать судебных споров об интеллектуальных правах, а также бороться с плагиатом и патентными троллями.
Как это работает
01/
Компания просит «Гардиум» зарегистрировать торговый знак: отправляет фото или PDF-файл
Нейросеть ищет похожие изображения среди тех, что отобрал алгоритм
«Гардиум» оценивает уникальность торгового знака, начинает регистрацию
Алгоритм отбирает изображения в базе с учётом указанного класса
«Гардиум» загружает изображение в поиск, указывает класс МКТУ
Детали
02/
При поиске похожих изображений нейросеть учитывает цвета, формы, второстепенные элементы (например, фон) и другие признаки. В топе выдачи отображаются изображения с наибольшим количеством совпадающих признаков.
Трудности проекта
03/
Проблема
Решение
Отсутствие размеченных данных для обучения и тестирования нейросети.
Алгоритм, который самостоятельно классифицирует изображения. Используя его разметку, мы обучили нейросеть.
Этапы разработки
04/
Разведка данных (разметка изображений в базе клиента для будущего поиска)
Шаг 01
Проверка гипотез о поиске, подбор эффективных компьютерных моделей
Шаг 02
Обучение нейросети на размеченных алгоритмом данных
Шаг 03
Внедрение классификатора для распределения изображений по классам
Шаг 04
Тестирование сервиса внутри EORA и на стороне клиента
Шаг 05
Разработка, интеграция сервиса с базой клиента через API
Шаг 06
Примеры работы системы
05/
Команда проекта
06/
Проектный менеджер
Алексей Гучко
Data scientist
Вячеслав Шульц
Тимлид
Владислав Виноградов
Иван Измайлов
Бэкенд-разработчик
Цитата
07/
«У нас не было предварительно размеченных данных, которые помогли бы нейросети понимать, какие варианты выдачи правильные, а какие нет. Для тренировки нейросети мы использовали метод обучения "без учителя". Результат превзошел ожидания. Точность поиска оказалась очень высокой, клиент остался доволен»
Руководитель проекта
Алексей Гучко
Сроки разработки
08/
3 месяца
сентябрь – ноябрь 2021 года
Технологии
09/
EORA Mage
Адаптируемая система поиска товаров по фотографиям