Система предлагает товары, которые могут понадобиться покупателю
Повышается средняя стоимость чека
На чем основаны рекомендации
История покупок конкретного пользователя
Сравниваем покупки разных пользователей
Смотрим на корзину, папку «мои желания» и уже совершенные покупки
Не учитываем:
местоположение и пол.
У двух пользователей похожие покупки — называем их «пользователями- близнецами».
Рекомендуем то, что уже купил «пользователь- близнец».
Технологии
Библиотека Spark
фреймворк для обработки большого потока данных
Матричное разложение ALS
алгоритм, позволяющий обрабатывать действия пользователей в реальном времени
намеренно ограничили систему теми пользователями, которые совершили не менее четырех покупок
каждые две недели обновляем данные, чтобы система не перегружалась
Маркетплейс — это всегда огромный массив данных (несколько миллионов строк в таблицах).
Поэтому мы:
Трудности проекта
Проблема
Приемка проекта затянулась, так как не было четких критериев качества.
Вывод
Нужно на переговорах с клиентом более детально прорабатывать и согласовывать метрики качества и способы их получения.
Проблема
В некоторые моменты сервис работал медленней, чем хотелось бы.
Решение
Нашли сложно воспроизводимый баг в коде и провели дополнительные оптимизации скорости работы алгоритмов.
Цитата
«Единственный недочет, на который жаловались при тестировании, — мужчине могли порекомендовать розовый чехольчик для телефона, но и с этим можно работать»
Надежда
Менеджер
Команда проекта
Менеджер
Надежда Загвозкина
Data Scientist
Олег Дурыгин
Junior Data Scientist
Александра Щетинина
Чему мы научились
Более вдумчиво работать с библиотеками для рекомендательных систем
Грамотно обрабатывать огромные массивы данных
Наши планы
Ведем переговоры с клиентом о поддержке и улучшении:
новые параметры (пол, возраст, локация)
оптимизация
Надежда
«Планируем и дальше развиваться в рекомендашках и наращивать компетенции».
Менеджер
Где можно применить наработки:
Маркетплейсы, интернет-магазины и вообще любые сущности, которые что-то продают.
Но лучше всего рекомендательные системы работают именно на огромных массивах данных.