Ответы пользователя sim3x по тегу «Crawling»

Задать вопрос

Ответы пользователя по тегу Crawling

Как получить офлайн-копию современного сайта?

sim3x @sim3x

Можно попробовать https://github.com/gildas-lormeau/SingleFile

Если требуется сохранить динамичность SPA, то скорее никак не сделать

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как ускорить большое количество get запросов?

sim3x @sim3x

Быстрее чем может отдать сервер - никак
Используйте scrapy - там есть весь требуемый функционал

Если сайт донор на шареде, то его еще может прибанить хостер
Потому не делайте на него 100RPS

Ответ написан более трёх лет назад

6 комментариев

6 комментариев
Архитектура поискового веб приложения?

sim3x @sim3x

Django + postgresql + shinxsearch

Нет никакого смысла "економить" и думать, что у вас "простое" приложение - используйте фреймворк

Но судя по тексту вопроса, вам стоит начать с задач попроще и там где есть полноценные пошаговые гайды

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как скачать десятки тысяч страниц из списка?

sim3x @sim3x

bash/sh
wget
curl

Ответ написан более трёх лет назад

7 комментариев

7 комментариев
Какую программу использовать как аналог Scrapyd для пауков Scrapy, написанных на python3?

sim3x @sim3x

stackoverflow.com/questions/37283531/scrapyrt-vs-s...

cron
systemd

Ответ написан более трёх лет назад

4 комментария

4 комментария
Python scrapy подойдет ли?

sim3x @sim3x

1 Полностью сьемитировать не получится
2 Да

Ответ написан более трёх лет назад

2 комментария

2 комментария

Самые активные сегодня

VoidVolker
- 3 ответа
- 0 вопросов
SmeliyR
- 1 ответ
- 1 вопрос
Drovosek01
- 1 ответ
- 1 вопрос
kamzonna
- 2 ответа
- 0 вопросов
layerspb
- 2 ответа
- 0 вопросов
rPman
- 1 ответ
- 0 вопросов

Как получить офлайн-копию современного сайта?

Как ускорить большое количество get запросов?

Архитектура поискового веб приложения?

Как скачать десятки тысяч страниц из списка?

Какую программу использовать как аналог Scrapyd для пауков Scrapy, написанных на python3?

Python scrapy подойдет ли?

Войдите на сайт