У нас задача, в рамках которой необходимо определить, когда один и тот же автомобиль выставлен на продажу на различных платформах объявлений, таких как Mobile.de, AutoScout24, или другие сайты с объявлениями. Основная сложность заключается в том, что VIN номер в объявлениях обычно не указывается, что делает прямое сравнение данных объявлений затруднительным.
Первоначально я рассматривал подход с использованием хешей изображений для сопоставления объявлений, но это может привести к ошибкам в случае, если изображения не являются уникальными или были взяты из общедоступных источников.
Вот несколько подходов, которые я рассматриваю:
- Анализ метаданных и текстовых данных объявлений.
- Использование алгоритмов компьютерного зрения для анализа изображений.
- Разработка или применение нейронных сетей для сопоставления объединенных данных (текст, изображения, метаданные).
Мне интересно узнать ваше мнение о возможных решениях этой задачи или опыт работы с подобными проблемами. Какие подходы или технологии вы бы рекомендовали для реализации этой системы? Есть ли специфические инструменты или библиотеки, которые могли бы помочь в решении этой задачи?
Благодарю за любые советы или предложения!