Авторизация
Забыли пароль?
Сброс пароля
Вернуться к авторизации

ML-решение для интернет-магазина Lamoda, которое ускорило обработку фото в 60 раз

06 декабря ‘24

Заказчик: Lamoda

Разработали и обучили ML-модель, которая автоматизировала работу ретушеров крупного интернет-магазина Lamoda

Агентство-исполнитель кейса

KozhinDev

Разрабатываем приложения, личные кабинеты и онлайн–сервисы для среднего и крупного бизнеса

1. Вводная задача от заказчика, проблематика, цели

Если вы когда-либо покупали одежду или обувь на Lamoda, то знаете, что товары в каталоге выглядят отлично — их хочется купить сразу. Созданием таких привлекательных фото занимается целый отдел фотографов и ретушеров. Ежедневно на собственной фотостудии компании проводится множество съемок новых товаров. После этого каждый отобранный кадр нужно привести к стандартам качества Lamoda. На каждую фотографию у ретушера уходит несколько минут — не так и много. Но в условиях быстро растущего интернет-магазина, куда постоянно нужно добавлять новые позиции, время имеет значение. Поэтому передать рутинную работу компьютеру — решение, которое поможет сократить временные и финансовые затраты. С этим представители Lamoda обратились к нам.

ML-модель обрабатывает фотографии обуви для онлайн-каталога

2. Описание реализации кейса и творческого пути по поиску оптимального решения

Для карточек в каталоге Lamoda важна ориентация объекта в кадре — он всегда должен быть расположен в центре, на фоне с градацией светлых оттенков, иметь тень, для которой также есть параметры. Чтобы обеспечить базовую обработку фото, мы использовали ансамбль из двух нейросетей:

  • Первая осуществляет дихотомическую сегментацию изображений. В результате изображение разделяется на сегменты или области, которые считаются однородными по некоторым критериям, например, по цвету, текстуре или интенсивности.
  • Вторая нейронная сеть, Deep-OAD — это модель глубокого обучения, которая определяет угол ориентации естественного изображения.

Также мы использовали набор морфологических операций библиотеки OpenCV для обработки разных ракурсов объекта — в профиль, сверху, и для поворота в пространстве.

Для обработки вида в профиль фото обуви загружается в сервис и автоматически обрабатывается нейросетью. Для этого используется несколько операций — установка объекта на фон, установка белого фона, затемнение, которое улучшает контраст и яркость изображения, делает его более насыщенным и выразительным, коррекция фона для оптимизации освещения и теней на фоне, чтобы сделать изображение более естественным.

Чтобы фото обуви сверху также смотрелось красиво, соответствовало стандартам интернет-магазина, изображение загружается по указанному пути, для его фона задается уровень белого, применяются такие операции, как коррекция поворота, коррекция наклона линии, позиционирование объекта. После этого устанавливается белый фон, производится затемнение фото и коррекция фона.

Поворот обуви был наиболее сложной задачей. Мы научили модель разворачивать объект на фото с помощью набора последовательных действий. Изображение загружается в систему, после этого нейросетевая модель Deep-OAD определяет необходимый угол, при котором обувь будет ориентирована корректно. После этого с помощью нескольких операций проводится цветовая коррекция фото и установка правильных фона и тени.

Для обучения модели мы использовали обширную базу уже обработанных сотрудниками фото и их исходников. На ее основе нейросеть научилась отличать корректно и некорректно повернутые объекты — буквально приобрела «насмотренность».

Корректируем вид объекта в профиль

Доводим вид сверху до совершенства

И наконец разворачиваем обувь

3. Результаты сотрудничества

Сервис, который мы создали для Lamoda:

  • обучается на базе уже созданных и отредактированных фотографий обуви — так он может решать сложные задачи по повороту изображения без строго заданного угла;
  • приводит фото к стандартам качества, установленным в компании;
  • редактирует фон, чтобы подать товар в выгодном свете.

Применяем морфологические операции — и происходит магия

4. Заключение

Сотрудники отдела обработки фото интернет-магазина Lamoda загружены работой, и часть их действий — рутинные и повторяющиеся. Например, выравнивание объекта, замена фона. Также на некоторых фото товар нужно повернуть под углом, значение которого не имеет строгого определения — для этого нужна насмотренность. Здесь на помощь ретушерам и приходит наш ML-сервис: он обучается на базе отредактированных фото и выполняет поворот и другие операции за 5–15 секунд вместо нескольких минут, которые тратит человек. В результате работа отдела обработки фото значительно ускорилась, время, которое сотрудники тратят на рутинные операции, сократилось приблизительно в 60 раз.

Агентство-исполнитель кейса

KozhinDev

Разрабатываем приложения, личные кабинеты и онлайн–сервисы для среднего и крупного бизнеса