Как правильно синхронизировать продукты с CSV?

Question

Посторонним В. @Audiophile

Magento

Как правильно синхронизировать продукты с CSV?

Стади кейс, который мне привели на собесе, и который я провалил, т. к. никогда ни с чем подобным не сталкивался.

Есть файл CSV, с несколькими десятками тысяч продуктов, есть Magento 2 с такого же порядка количеством продуктов в базе. Задача - максимально эффективно, не положив сервак (из-за перегрузки по памяти) и не сломав базу, сделать следующее:
1. Обновить атрибуты продуктов, SKU которых уже есть в базе.
2. Добавить продукты, которых еще нет.
3. Удалить продукты из базы Magento, SKU которых нет в CSV.

Вопрос- каковым будет вцелом алогритм работы кода, который будет это делать. (а делать он это будет по крону скорей всего).
Может есть готовые решения (алгоритмы, подходы, паттерны), о которых я не знаю?

На все мои попытки составить алгоритм были возражения либо что пхп съест много памяти, либо что MySQL не обработает такой огромный запрос.

Вопрос задан более трёх лет назад
122 просмотра

Комментировать

Подписаться 2 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 3

Комментировать

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Magento

Средний
Не работает редирект в Magento2 c /pub/?
- 1 подписчик
- 05 янв.
- 22 просмотра
0

ответов
Базы данных

+1 ещё

Средний
Как добавить колонки в таблицу из модуля, который расширяет другой модуль?
- 1 подписчик
- 18 дек. 2023
- 35 просмотров
0

ответов
PHP

+1 ещё

Простой
Как проще и правильнее в phtml вызвать метод другого — соседнего класса?
- 1 подписчик
- 17 окт. 2023
- 60 просмотров
1

ответ
MySQL

+1 ещё

Простой
Как пофиксить ошибку Incorrect TIMESTAMP value?
- 1 подписчик
- 31 авг. 2023
- 197 просмотров
2

ответа
Magento

+1 ещё

Средний
Как настроить grunt и livereload для удаленной Magento2?
- 1 подписчик
- 11 июл. 2023
- 11 просмотров
0

ответов
CSV

+2 ещё

Средний
Как исправить ошибку при попытке импорта изображения через .csv файл Magento2?
- 1 подписчик
- более года назад
- 32 просмотра
0

ответов
Magento

Средний
Как создать collectionFactory для переопределния запроса по другому параметру в m2?
- 1 подписчик
- более года назад
- 45 просмотров
1

ответ
Magento

Средний
Как правильно отобразить блок на самом верху сайта?
- 1 подписчик
- более года назад
- 39 просмотров
1

ответ
PHP

+1 ещё

Средний
Как отобразить .phtml в Magento2 без использования модуля?
- 1 подписчик
- более года назад
- 128 просмотров
1

ответ
Magento

Простой
Как авторизоваться в Magento 2.4.1?
- 1 подписчик
- более года назад
- 30 просмотров
0

ответов
Показать ещё Загружается…

Стажёр PHP-разработчик

Intensa • Тула

от 40 000 до 60 000 ₽

Специалист по работе с договорами (Отдел обеспечения аутсорсинговых операций)

SM Lab • Москва

До 100 000 ₽

Менеджер по работе с данными

Точка • Москва

от 120 000 до 200 000 ₽

Перекрасить 2 вкладыша в новый цвет

18 апр. 2024, в 11:36

300 руб./за проект

Разработать модуль на Python для создания bitcoin транзакций

18 апр. 2024, в 11:20

5000 руб./за проект

Доработать калькулятор, исправить ошибки (PHP, YII2) Часть 3

18 апр. 2024, в 11:12

8200 руб./за проект

Answer 1 · 2019-12-29 15:34:14

Лев Забудкин @zabudkin

Инженер-системотехник, программист, админ, ТПУ!!!!

Кто Вам говорил про память - в топку.
1. Всё ручками, точнее запросами.
2. Всё.

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2019-12-29 15:40:38

Антон Шаманов @SilenceOfWinter

та еще зажигалка...

blog.nagaychenko.com/2010/04/29/%D0%BA%D0%B0%D0%BA... скорее всего что-то вроде этого хотели

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2019-12-29 16:30:20

1 и 2. Учитывая, что SKU, как я понимаю, уникальное по смыслу значение, на нем висит UNIQUE индекс. Таким образом, можно читать csv-файл построчно и юзать on duplicate key update. Это позволит всего одним циклом обновить атрибуты или добавить недостающие товары в таблицу.

3. Чтобы удалить продукты из базы Magento, SKU которых нет в CSV, надо блоками (по 100 строк, например) читать таблицу товаров в базе и проверять наличие этих SKU в csv-файле. Если не найдено, писать id в массив. После этого сделать удаление всех строк по этим idшникам с момощью sql-оператора IN. Если в массиве набралось очень много id-шников, есть смысл также разделить их на блоки, чтобы в IN не было очень много idшников. Это можно оптимизировать, если на шаге 1 и 2 в пхп-массив писать считанные из файла SKU (даже если там 100к строк, это не сильно много памяти отъест в данном случае) - тогда даже искать в csv-файле не надо будет, достаточно будет проверить просто наличие SKU, взятого из базы, в этом массиве.

P.s. насчет 3. Возможно, было бы еще эффективней в таблицу с товарами добавить столбец, в который на шаге 1 и 2 в том же sql-запросе писать (или переписывать старое значение) текущую дату и время для обработанных записей. После чего всего одним запросом к базе выпилить из таблицы все, что старое (потому что если записано старая дата и время, значит, в csv-файле товара с таким SKU не было, и его можно удалить).

Как правильно синхронизировать продукты с CSV?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт