Задать вопрос
gadfi
@gadfi
https://gamega.org

Как парсить теги?

Здравствуйте.
Есть сторонний ресурс, пишу парсер+rest api для него.
Вопрос как правильно парсить теги, первое что приходит в голову это тупо спарсить теги со страницы, проверить есть ли каждый тег в таблице если нет записать, если есть использовать тот что в таблице, на следующей странице повторить.
Все просто но мне не нравится большое количество запросов, с вебом работаю очень мало и такое решение кажеться кривоватым.
Как вариант, чтобы уменьшить количество обращений к бд, держать словарь тегов в памяти их около тысячи
  • Вопрос задан
  • 2679 просмотров
Подписаться 2 Оценить Комментировать
Решения вопроса 4
orlov0562
@orlov0562 Куратор тега PHP
I'm cool!
Надо смотреть на нагрузку и скорость работы остального, если все остальное очень быстро, тогда можно словарь использовать. В противном случае можно и базу подергать, если с настройками базы все ок, то она и так закеширует частые запросы. Если это уник значения и будет уникальный индекс, то выборка не составит труда, если вдруг будет много-много данных, то можно создать memory table и дергать оттуда, ну или использовать любой дополнительный кеширующий механизм... В любом случае, я думаю что скорость обработки тегов как и сам парсинг не будет горлышком бутылки.. Основной тормоз будет на загрузке страниц.
Ответ написан
Комментировать
@deliro
Тысяча тегов в памяти занимают около 10кб. Можешь держать в памяти.
Ответ написан
Комментировать
Используйте подготовленные запросы php.net/manual/ru/mysqli.quickstart.prepared-state...
Ответ написан
Комментировать
TheCreator
@TheCreator
Бездельник
Вы сделайте по-простому, если будут проблемы с производительностью (а их, похоже, не должно быть) - переделаете.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы