Вываливается парсинг. Connect error. Как исправить?

Question

AnKus @AnKus

Вываливается парсинг. Connect error. Как исправить?

Есть код. Рабочий 100%, собирает правильне ссылки с 2-3 страниц. Дальше начинает выдавать ошибку:

requests.exceptions.ConnectionError: HTTPSConnectionPool(host='krs-pobierz.pl', port=443): Max retries exceeded with url: /b-m-moscinscy-spolka-jawna-i6490187 (Caused by NewConnectionError(': Failed to establish a new connection: [Errno 113] No route to host'))

Обрабоки try except не решают проблемы, как и max_retry
Вот код:

headers = {
"Accept": "*/*",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:101.0) Gecko/20100101 Firefox/101.0"}

first_links = []
for i in range(1, 10):
url = 'https://krs-pobierz.pl/szukaj?q=4110Z&page={}'.format(i)

while True:
    try:
        r = requests.get(url, headers)
    except requests.exceptions.ConnectionError:
        time.sleep(2)
        continue

soup = BeautifulSoup(r.text, 'lxml')
boxes = soup.find_all('div', class_='col-9')
for l in boxes:
    links = l.find('a').get('href')
    while True:
        try:
            q = requests.get(links)
        except requests.exceptions.ConnectionError:
            time.sleep(2)
            continue

    result = q.content
    soup = BeautifulSoup(result, 'lxml')
    try:
        kved_text = soup.find_all('td', class_='col-xs-8')[13].text
    except IndexError as ex:
        kved_text = '-'
    if(kved_text == 'Realizacja projektów budowlanych związanych ze wznoszeniem budynków (4110Z)'):
        first_links.append(links)
    else:
        continue

with open('first_links.txt', 'a') as f:
    for line in first_links:
        f.write(f'{line}\n')

Вопрос задан более года назад
243 просмотра

7 комментариев

Подписаться 1 Простой 7 комментариев

Алан Гибизов @phaggi Куратор тега Python

А вы его по сусалам, чтоб не выделывался.
Как хоть выделывается, с подвыподвертом или так?

Написано более года назад
AWEme @AWEme

Алан Гибизов, с двумя бесконечными циклами.

Написано более года назад
AnKus @AnKus Автор вопроса

Алан Гибизов, а судя по тем исключениям, что добавляю не ясно, или вам лишь бы 5 коп вставить не по делу ?!

Написано более года назад
AnKus @AnKus Автор вопроса

AWEme, в данном случае они погоду не делают

Написано более года назад
Алан Гибизов @phaggi Куратор тега Python

AnKus, добавленные вами перехваты исключений могут ведь и ошибочно быть добавлены, я же не знаю, что там внутри происходило?

Как куратор тэга python рекомендую вам доработать вопрос, а именно:
Исправить название вопроса в соответствии с п.3.4 Регламента.
Добавить в тело вопроса подробности, которые помогут отвечающим, а именно: traceback, если таковой был; подробности о поведении программы;
как именно программа начинает выделываться (до попыток решить проблему); как именно вы пробовали решить проблему, и какие результаты получали на ваши попытки.
Также рекомендую спрятать длинные портянки кода под спойлер.

Всё это поспособствует, чтобы отвечающие не отгадывали «по линиям вашего кода», как вы пытались «бороться». И вероятность получения нужного вам ответа повысится.

Написано более года назад
Алан Гибизов @phaggi Куратор тега Python

Также хорошо бы минимизировать пример, оставив лишь необходимое для воспроизведения ошибок.

Написано более года назад
AWEme @AWEme

AnKus, Имеет смысл оформить код правильно

Написано более года назад

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Простой
Как пройти авторизацию на youtube с помощью selenium?
- 1 подписчик
- 6 часов назад
- 26 просмотров
2

ответа
Python

+2 ещё

Простой
Как установить 2 версии libssl в kubuntu 22.04?
- 2 подписчика
- 15 часов назад
- 128 просмотров
0

ответов
Python

Простой
Как в библиотеке Flet при нажатии на кнопку сделать, чтобы появилось всплывающее окно?
- 1 подписчик
- 15 часов назад
- 21 просмотр
0

ответов
Python

+1 ещё

Сложный
Интерпретация результатов модели lambdamart?
- 1 подписчик
- 17 часов назад
- 22 просмотра
0

ответов
Python

Простой
Как в конце каждой строки файла добавить тэг?
- 1 подписчик
- вчера
- 131 просмотр
1

ответ
Python

+1 ещё

Простой
Почему asyncio.current_task() не передается в функцию?
- 1 подписчик
- вчера
- 92 просмотра
1

ответ
Python

+2 ещё

Простой
Срабатывает антивирус на скомпилированный файл python, как исправить?
- 1 подписчик
- 22 апр.
- 202 просмотра
1

ответ
Python

Простой
Почему не срабатывает if? как это пофиксить?
- 1 подписчик
- 22 апр.
- 150 просмотров
2

ответа
Python

+2 ещё

Простой
Как транслировать аудио в микрофон, py, c#, c++?
- 1 подписчик
- 22 апр.
- 171 просмотр
3

ответа
Python

Средний
Почему Низкий FPS анализ изображения yolov8 YOLO?
- 2 подписчика
- 22 апр.
- 33 просмотра
0

ответов
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Спарсить TON PLACE: скрейпинг фото и текста с анкет по списку URL

25 апр. 2024, в 05:57

3000 руб./за проект

Правки в webApp готового и написанного телеграмм бота next, tailwind

25 апр. 2024, в 05:29

25000 руб./за проект

Фронтер - DevOps. Развернуть фронт на хостинге. Прокинуть в телегу-бот

25 апр. 2024, в 04:38

10000 руб./за проект

А вы его по сусалам, чтоб не выделывался.
Как хоть выделывается, с подвыподвертом или так?
Алан Гибизов, с двумя бесконечными циклами.
Алан Гибизов, а судя по тем исключениям, что добавляю не ясно, или вам лишь бы 5 коп вставить не по делу ?!
AWEme, в данном случае они погоду не делают
AnKus, добавленные вами перехваты исключений могут ведь и ошибочно быть добавлены, я же не знаю, что там внутри происходило?

Как куратор тэга python рекомендую вам доработать вопрос, а именно:
Исправить название вопроса в соответствии с п.3.4 Регламента.
Добавить в тело вопроса подробности, которые помогут отвечающим, а именно: traceback, если таковой был; подробности о поведении программы;
как именно программа начинает выделываться (до попыток решить проблему); как именно вы пробовали решить проблему, и какие результаты получали на ваши попытки.
Также рекомендую спрятать длинные портянки кода под спойлер.

Всё это поспособствует, чтобы отвечающие не отгадывали «по линиям вашего кода», как вы пытались «бороться». И вероятность получения нужного вам ответа повысится.
Также хорошо бы минимизировать пример, оставив лишь необходимое для воспроизведения ошибок.
AnKus, Имеет смысл оформить код правильно

Answer 1 · 2022-08-15 22:14:33

Dimonchik @dimonchik2013

non progredi est regredi

прокси тебу нужен, начальник
или хотя бы таймауты

там простейший отсекалка стоит

Ответ написан более года назад

1 комментарий

Вываливается парсинг. Connect error. Как исправить?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт