Задать вопрос

reapersuper14

Александр Втюрин @reapersuper14

Python-программист-студент. Учусь делать круто.

python

Python

Как загружать большие страницы с помощью Grab:Spyder?

Доброго времени суток, друзья.

Загружаю множество страниц из интернетов и складываю содержимое в бд. Те страницы, что небольших размеров, загружаются без проблем, но страницы большого объема в лог пишут следующее:
DEBUG:grab.stat:RPS: 0.26 [error:operation-timeouted=7]
Выделенные курсивом цифры меняются от страницы к странице.

Перерыл всю документацию Grab'а, все Issues на гитхабе, все посты в GoogleGroups. Даже исходники поковырял. Много чего нового узнал, но только не значение загадочного "timeouted".

Дорогие друзья, объясните, пожалуйста, что эта ошибка из лога значит (предполагаю, что "соединение разорвано, т.к. превышен интервал ожидания") и как сделать так, чтобы паучки качали страницы любых объемов.

UPD:
Забыл упомянуть, я использую прокси-сервер.
Без него мне просто дают 429 ошибку в 75% случаев.

Вопрос задан более трёх лет назад
190 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 1

dimonchik2013

Dimonchik @dimonchik2013

non progredi est regredi

grab использует pycurl, можете попробовать его опциями задать

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Существуют ли сервисы: онлайн python editor для совместного использования?
- 1 подписчик
- 3 часа назад
- 41 просмотр
1

ответ
Python

Простой
На каком языке пишут описание функций в Python?
- 1 подписчик
- вчера
- 236 просмотров
3

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 229 просмотров
1

ответ
Python

Простой
Как парсить pdf-ки с вк с помощью Python?
- 1 подписчик
- 16 сент.
- 320 просмотров
1

ответ
Python

+1 ещё

Простой
Почему возникает синтаксическая ошибка: invalid decimal literal?
- 1 подписчик
- 15 сент.
- 168 просмотров
2

ответа
Python

+1 ещё

Простой
Почему модель обнаружения объектов YOLO работает медленно?
- 1 подписчик
- 14 сент.
- 188 просмотров
1

ответ
Python

Простой
Что можно улучшить или оптимизировать в коде, чтобы он не был таким длинным?
- 2 подписчика
- 10 сент.
- 436 просмотров
4

ответа
Python

+3 ещё

Простой
Есть решение сборки Python в Exe с библиотекой Opencv?
- 1 подписчик
- 09 сент.
- 168 просмотров
0

ответов
Python

Простой
Как получить из URL имя страницы?
- 1 подписчик
- 08 сент.
- 199 просмотров
2

ответа
Python

+1 ещё

Простой
Почему у Python проблемы с форматированием?
- 1 подписчик
- 08 сент.
- 228 просмотров
1

ответ
Показать ещё Загружается…

Python developer

Digital Clouds

от 160 000 ₽

Python разработчик

Selecty

от 280 000 до 380 000 ₽

Python разработчик

ITK academy • Казань

от 75 000 ₽