Как привести прайсы поставщиков к единому виду?

Question

ace-of-spades @ace-of-spades

Как привести прайсы поставщиков к единому виду?

Вот, что есть:

1. Есть три прайса от разных поставщиков (в будущем может быть больше).
2. В каждой два столбца: название товара и цена. Примерно 10 000 позиций.
3. Во всех таблицах есть одни и те же товары, но названия отличаются. Например: в одной «шоколадка марс», в другой «марс шоколад», или «смартфон iphone6» и «телефон i phone 6». То есть как перестановка слов, так и пробелы, сокращения и прочее.

Задача: найти одинаковые товары и проставить им единый идентификатор во всех трёх таблицах.
Проблема: как максимально точно определить совпадения?

Как я думаю можно это решить: берём за основу одну таблицу и ищем совпадения в других таблицам по словам (с перестановкой букв и совпадением до n числа букв, но цифры не трогаем). Плюс используем цены, как критерий совпадения, то есть задаём порог: не должна отличаться более, чем, допустим, на 100 рублей.

Или считать процентное отклонение, по словам и по цене.

Это реально? Или можно проще, и я заморочился? Может есть готовые решения?

А конечная цель такая: в интернет-магазине на WP обновлять ценники на меньший из всех прайсов.

Если придётся заказывать скрипт/плагин у программиста, какой может быть примерный ценник? Если делать по существу (это как-будто ML) и возможностью подгружать дополнительные прайсы.

Всем неравнодушным спасибо!

Вопрос задан более трёх лет назад
296 просмотров

5 комментариев

Подписаться 1 Средний 5 комментариев

FlipWho @FlipWho

В дополнение ко всему - я бы посоветовал к артикулам добавлять идентификатор поставщика. Т.е. шоколадка у всех с артикулом 123, так вот дешевле у поставщика 1, идентификатор у него А. Значит в каталог заносить шоколадку с артикулом А123, чтобы потом сразу знать, у какого поставщика её закупать.

Написано более трёх лет назад
lamer350 @lamer350

У всех нормальных поставщиков прайсы с артикулом и изобретать велосипед тут не нужно.

Написано более трёх лет назад
Antonio Solo @solotony

lamer350, только у каждого артикулы будут свои

Написано более трёх лет назад
lamer350 @lamer350

Antonio Solo, если только поставщики поставляют какого то ноунейм товар, а так артикул - это "уникальный идентификатор товара" который не может отличатся у разных поставщиков так как составляется по определенным правилам заводом изготовителем. Пример: MacBook MF839 (артикул), его артикул нигде не будет отличатся, во всех магазинах/прайсах будет идентичный.

Написано более трёх лет назад
65536 @65536

реально, но адски сложно. прайсы поставщиков это хаос. полгода решали эту задачу, мб когда-нибудь в сервис превратим. тема востребованная, но из готовых решений ничего эту задачу не решает даже на половину. точнее эта тема уже даже не востребованная так как все привыкли к тому что она нерешаемая

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Stepik

Курс по WordPress с нуля до результата. Создание сайтов без кода

2 недели

Далее
beONmax

Профессия WordPress разработчик

3 месяца

Далее
Яндекс Практикум

Фулстек-разработчик расширенный

20 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

WordPress

Средний
Как настроить время сессии в WordPress для редактирования страницы?
- 1 подписчик
- 10 июл.
- 119 просмотров
1

ответ
WordPress

Средний
Как задать цвет шрифта строчки меню, соответствующий той странице, на которой пользователь сайта находится в данный момент?
- 1 подписчик
- 25 июн.
- 118 просмотров
2

ответа
WordPress

Средний
Что делать, если Elementor выводит пустое окно при попытке сохранения шаблона?
- 1 подписчик
- 16 июн.
- 85 просмотров
2

ответа
WordPress

+1 ещё

Простой
Не рабтает меню на iphone (wordpress)?
- нет подписчиков
- 15 июн.
- 149 просмотров
1

ответ
WordPress

Средний
Не отображается шрифт на мобильных устройствах?
- 1 подписчик
- 30 мая
- 89 просмотров
1

ответ
WordPress

+1 ещё

Простой
Плагин WP All Import не всегда видит и обновляет данные, куда копать?
- 2 подписчика
- 28 мая
- 59 просмотров
1

ответ
WordPress

Средний
Проблема с выводом хлебных крошек wordpress flatsome portfolio, как исправить?
- 1 подписчик
- 29 апр.
- 95 просмотров
3

ответа
WordPress

Простой
Почему при формировании новой записи в блоге Wordpress пропадает изображение (фотография) записи?
- 1 подписчик
- 05 апр.
- 178 просмотров
1

ответ
WordPress

Средний
Как исправить ошибку при редактировании страницы WordPress?
- 1 подписчик
- 02 апр.
- 143 просмотра
1

ответ
WordPress

Средний
Как сделать метки к определенной рубрике в wordpress?
- 1 подписчик
- 26 мар.
- 91 просмотр
1

ответ
Показать ещё Загружается…

В дополнение ко всему - я бы посоветовал к артикулам добавлять идентификатор поставщика. Т.е. шоколадка у всех с артикулом 123, так вот дешевле у поставщика 1, идентификатор у него А. Значит в каталог заносить шоколадку с артикулом А123, чтобы потом сразу знать, у какого поставщика её закупать.
У всех нормальных поставщиков прайсы с артикулом и изобретать велосипед тут не нужно.
lamer350, только у каждого артикулы будут свои
Antonio Solo, если только поставщики поставляют какого то ноунейм товар, а так артикул - это "уникальный идентификатор товара" который не может отличатся у разных поставщиков так как составляется по определенным правилам заводом изготовителем. Пример: MacBook MF839 (артикул), его артикул нигде не будет отличатся, во всех магазинах/прайсах будет идентичный.
реально, но адски сложно. прайсы поставщиков это хаос. полгода решали эту задачу, мб когда-нибудь в сервис превратим. тема востребованная, но из готовых решений ничего эту задачу не решает даже на половину. точнее эта тема уже даже не востребованная так как все привыкли к тому что она нерешаемая

Answer 1 · 2019-04-23 17:51:38

Александр Денисов @Grinvind

Помогаю увеличивать трафик с поисковых систем

Попробуйте вот это: https://habr.com/ru/post/428814/

Ответ написан более трёх лет назад

2 комментария

Answer 2 · 2019-04-23 17:29:46

Думаю любой алгоритм будет давать ошибку
Как вариант: Удалить все пробелы и не цифро-буквенные символы, привести к одному регистру и сложить коды символов. Получится слабое подобие хэша. таким образом можно найти все совпадения вне зависимости от перестановки слов. Если в позициях будет "шоколад" и "шоколадка", то этот метод покажет несовпадение. Для учета и этого различия, можно запустить предварительную авто-замену однокоренных слов на какое-то определенное значение.

Ну и дальше можно разные авто-замены придумывать, для приближения к идеалу.
Но вероятность ошибки все равно остается.

Answer 3 · 2019-04-29 19:11:00

1) прогнать и слить строгие совпадения
2) для нестрогих совпадений сделать "склейщик" - автоматизированное рабочее место для просмотра и построения связей 10000 немного.

Answer 4 · 2023-03-05 11:11:34

dmitriy @dmitriylanets

веб-разработчик

Можно воспользоваться сервисом https://partscanner.ru/

Ответ написан более трёх лет назад

Комментировать

Как привести прайсы поставщиков к единому виду?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт