humiliation
@humiliation
Чем больше знаю - тем больше дурак

Как правильно получить весь сайтмап с кодом ответа?

Приветствую,

есть у меня сайт на битриксе, в нем - около 100т. страниц.
Тут оптимизатор решил что в сайтмапе должны быть только страницы с ответом сервера 200. 301, 302, 404 и прочие нам тут не нужны.
Написал агент, протестил его на инфоблоке с сотней записей, все отлично отработало. Но как только я сделал выборку ~5000, скрипт стал работать не очень. В принципе, оно и логично - 0,2s на запрос до урла через cURL, как раз где-то час и выходит.

Подскажите, каким образом вы бы решили такую задачу?

У меня сейчас есть идея разобрать этот функционал на 3 скрипта, один делает выборку урлов по 1 инфоблоку за раз, второй cURLом бегает по массиву через sleep, так же по одному инфоблоку за раз, третий потом все это объединяет в один .xml. Не знаю насколько быстрее получится.

А может и не надо вовсе бегать курлом...?
  • Вопрос задан
  • 196 просмотров
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
вообще решается со стороны сайта, через роутер т.е.

но если решили внешне - нет способа кроме как перебать

или оставьте как есть и чистите по логам уже
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы