Как парсить теги?

Question

Олег Гамега @gadfi

https://gamega.org

Как парсить теги?

Здравствуйте.
Есть сторонний ресурс, пишу парсер+rest api для него.
Вопрос как правильно парсить теги, первое что приходит в голову это тупо спарсить теги со страницы, проверить есть ли каждый тег в таблице если нет записать, если есть использовать тот что в таблице, на следующей странице повторить.
Все просто но мне не нравится большое количество запросов, с вебом работаю очень мало и такое решение кажеться кривоватым.
Как вариант, чтобы уменьшить количество обращений к бд, держать словарь тегов в памяти их около тысячи

Вопрос задан более трёх лет назад
2690 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Веб-разработчик на PHP

9 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее

Решения вопроса 4

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- вчера
- 60 просмотров
0

ответов
Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 2 подписчика
- 20 нояб.
- 278 просмотров
2

ответа
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 211 просмотров
1

ответ
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 333 просмотра
2

ответа
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб.
- 356 просмотров
4

ответа
PHP

+1 ещё

Простой
Запрос на создание таблицы в clickhouse Yandex выдает ошибку 400 Bad Request, что не так с моим запросом?
- 1 подписчик
- 13 нояб.
- 229 просмотров
4

ответа
Node.js

+1 ещё

Простой
Какие есть пакеты для генерации уникальных, числовых идентификаторов длиной 10 цифр?
- 1 подписчик
- 10 нояб.
- 275 просмотров
2

ответа
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 247 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 160 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 135 просмотров
1

ответ
Показать ещё Загружается…

PHP-разработчик

FoodSoul • Калининград

от 180 000 до 250 000 ₽

PHP- разработчик (Symfony)

IT-Spirit • Москва

от 230 000 до 320 000 ₽

Backend PHP developer

Office-Expert.kz

от 200 000 до 290 000 ₽

Answer 1 · 2015-06-19 22:21:58

Надо смотреть на нагрузку и скорость работы остального, если все остальное очень быстро, тогда можно словарь использовать. В противном случае можно и базу подергать, если с настройками базы все ок, то она и так закеширует частые запросы. Если это уник значения и будет уникальный индекс, то выборка не составит труда, если вдруг будет много-много данных, то можно создать memory table и дергать оттуда, ну или использовать любой дополнительный кеширующий механизм... В любом случае, я думаю что скорость обработки тегов как и сам парсинг не будет горлышком бутылки.. Основной тормоз будет на загрузке страниц.

Answer 2 · 2015-06-19 22:30:12

Roman K @deliro

Тысяча тегов в памяти занимают около 10кб. Можешь держать в памяти.

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2015-06-19 22:47:16

Андрей @ntzch

Используйте подготовленные запросы php.net/manual/ru/mysqli.quickstart.prepared-state...

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2015-06-19 23:01:16

Вы сделайте по-простому, если будут проблемы с производительностью (а их, похоже, не должно быть) - переделаете.

Как парсить теги?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт