Авторизация
Забыли пароль?
Сброс пароля
Вернуться к авторизации

Артрегистратор: система распознавания произведений искусства

08 апреля ‘25

Заказчик: United Kingdom Creative Ideas Ltd.

Мы разработали систему, которая распознаёт картины по фото и определяет их автора, название и век.

Агентство-исполнитель кейса

Эпоха Восемь (Epoch8)

Epoch8 создаёт AI-решения для сложных задач: от визуального поиска по музейным коллекциям до распознавания объектов в реальной среде.

1. Вводная задача от заказчика, проблематика, цели

United Kingdom Creative Ideas Ltd. (UKCI) — международная компания с центральным офисом в Лондоне, являющаяся регистратором и владельцем доменной зоны. Основной проект компании — управление доменной зоной .art. Помимо этого, они развивают сервисы для художников и коллекционеров, объединяя искусство и технологии.

Компания обратилась к нам с идеей: создать технологию, которая позволит пользователю сделать снимок картины на смартфон и получить информацию о ней за считанные секунды. Кто автор? Как называется картина? В каком веке нарисована? И все это без экспертов и ручного поиска.

Задача требовала комплексного подхода:

  • Разработать алгоритм, который сопоставляет картину на фотографии с ее оригиналом из каталога музея The Metropolitan (The Met).
  • Оценить качество поиска по каталогу, выявить основные проблемы и сформировать план их решения.

2. Описание реализации кейса и творческого пути по поиску оптимального решения

Мы начали с интеграции с датасетом MetObjects - открытой коллекцией музея The Met, включающей более 470 000 произведений искусства.

После анализа данных наша система теперь способна за 2 секунды определить характеристики картины: автора, век и название.

Система ищет картины двумя способами:

  • Через API музея The Met по ключевым словам: например, painting, landscape, portrait и др.
  • По ключевым словам в датасете MetObjects.

Результаты двух подходов были объединены. Таким образом, мы собрали стартовую выборку из около 25 000 произведений.

После этого началась работа с изображениями. Мы протестировали несколько алгоритмов для поиска совпадений между фото и оригиналами.

Один из них — эмбедеры.

Эмбедер — это нейронная сеть. Такая модель обучается как классический классификатор. На этапе применения модели обычно используется последний полносвязный слой, который преобразует изображение в числовой вектор длины n.

SIFT и алгоритмы классического компьютерного зрения

Мы протестировали классические архитектуры классификаторов, такие как ResNet50 и MobileNet, а также архитектуры с использованием слоя ArcFace. Этот слой на этапе обучения увеличивает расстояние между эмбеддингами объектов разных классов.

Для повышения устойчивости моделей мы использовали искажённые и разномасштабные изображения, чтобы минимизировать переобучение. Совпадения фильтровались с помощью специальных метрик, отсеивающих “шумовые” совпадения.

Как работает система

Полный пайплайн включает в себя:

  • 1. Детекцию картин на фото.
  • 2. Матчинг (сопоставление) выделенных детектором картин.
  • 3. Расширение каталога.

Детекция картин на фото

В качестве детектора была обучена модель CenterNet ResNet50. Обучающая выборка включала 367 музейных фотографий с вручную размеченными объектами (картинами и рисунками).

Во время тестирования возникла сложность: в отличие от тестовых фотографий, в реальной жизни на снимке может присутствовать не одна картина, а сразу несколько, включая частично попавшие или “фоновые”. Мы дообучили модель на таких примерах, чтобы она научилась выделять все релевантные объекты в кадре.

Сбор информации по выделенным детектором картин и матчинг

После того как детектор выделяет все интересующие картины на фотографии, система приступает к поиску их соответствий в базе. Здесь возникает нюанс: мы используем расширенную валидацию, включающую не только основные картины, но и дополнительные, находящиеся рядом с ними.

Однако для большинства таких дополнительных картин у нас нет разметки на класс. Иными словами, в базе нет картин, с которыми их можно сопоставить. Поэтому следующая задача - расширить каталог.

Расширение каталога

Мы начали с подключения датасета WikiArt, содержащего более 81 000 произведений, классифицированных по авторам и стилям. На его основе мы продолжаем расширять выборку, чтобы увеличить точность распознавания и покрытие.

3. Результаты сотрудничества

  • Алгоритм матчинга работает не только с фотографиями картин, но и с фотографиями рисунков.
  • Выстроен рабочий пайплайнохватывающий весь процесс — от детекции картин и рисунков на фотографиях до их матчинга.
  • Каталог был расширен до 90 000 объектов, включая картины и рисунки, а пайплайн успешно справляется с глобальным поиском, демонстрируя хорошие результаты.

4. Заключение

Проект для UKCI объединил сложную инженерную задачу, культурный контекст и практическое применение. Мы создали систему, которая позволяет за секунды распознать произведение искусства по фотографии.

Система справляется с реальными условиями: музейными интерьерами, частичным попаданием в кадр, соседними объектами. Она адаптируется, масштабируется и уже сегодня показывает стабильную работу на базе из 90 000+ произведений.

Для UKCI это не просто технологический инструмент, а часть стратегического направления – создание цифровой инфраструктуры, которая делает искусство доступнее, понятнее и ближе к зрителю.

Агентство-исполнитель кейса

Эпоха Восемь (Epoch8)

Epoch8 создаёт AI-решения для сложных задач: от визуального поиска по музейным коллекциям до распознавания объектов в реальной среде.