Как разработать систему идентификации одного и того же автомобиля на различных сайтах объявлений?

У нас задача, в рамках которой необходимо определить, когда один и тот же автомобиль выставлен на продажу на различных платформах объявлений, таких как Mobile.de, AutoScout24, или другие сайты с объявлениями. Основная сложность заключается в том, что VIN номер в объявлениях обычно не указывается, что делает прямое сравнение данных объявлений затруднительным.

Первоначально я рассматривал подход с использованием хешей изображений для сопоставления объявлений, но это может привести к ошибкам в случае, если изображения не являются уникальными или были взяты из общедоступных источников.

Вот несколько подходов, которые я рассматриваю:

  1. Анализ метаданных и текстовых данных объявлений.
  2. Использование алгоритмов компьютерного зрения для анализа изображений.
  3. Разработка или применение нейронных сетей для сопоставления объединенных данных (текст, изображения, метаданные).


Мне интересно узнать ваше мнение о возможных решениях этой задачи или опыт работы с подобными проблемами. Какие подходы или технологии вы бы рекомендовали для реализации этой системы? Есть ли специфические инструменты или библиотеки, которые могли бы помочь в решении этой задачи?

Благодарю за любые советы или предложения!
  • Вопрос задан
  • 421 просмотр
Пригласить эксперта
Ответы на вопрос 1
@DDV23
Биокибернетик
Напишите фильтрацию по ключевым атрибутам и сужайте количество потенциальных совпадений. Это не 100% но вполне реально.
Берём основные параметры - марка, модель, год выпуска, пробег, цвет, тип кузова, и начинаем фильтровать и постепенно сужаем круг. Тестируем - это займет всего немного времени, но Вы успеете задуматься о том, что пора бы прикупить краску для волос.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы