Вываливается парсинг. Connect error. Как исправить?

Question

AnKus @AnKus

Вываливается парсинг. Connect error. Как исправить?

Есть код. Рабочий 100%, собирает правильне ссылки с 2-3 страниц. Дальше начинает выдавать ошибку:

requests.exceptions.ConnectionError: HTTPSConnectionPool(host='krs-pobierz.pl', port=443): Max retries exceeded with url: /b-m-moscinscy-spolka-jawna-i6490187 (Caused by NewConnectionError(': Failed to establish a new connection: [Errno 113] No route to host'))

Обрабоки try except не решают проблемы, как и max_retry
Вот код:

headers = {
"Accept": "*/*",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:101.0) Gecko/20100101 Firefox/101.0"}

first_links = []
for i in range(1, 10):
url = 'https://krs-pobierz.pl/szukaj?q=4110Z&page={}'.format(i)

while True:
    try:
        r = requests.get(url, headers)
    except requests.exceptions.ConnectionError:
        time.sleep(2)
        continue

soup = BeautifulSoup(r.text, 'lxml')
boxes = soup.find_all('div', class_='col-9')
for l in boxes:
    links = l.find('a').get('href')
    while True:
        try:
            q = requests.get(links)
        except requests.exceptions.ConnectionError:
            time.sleep(2)
            continue

    result = q.content
    soup = BeautifulSoup(result, 'lxml')
    try:
        kved_text = soup.find_all('td', class_='col-xs-8')[13].text
    except IndexError as ex:
        kved_text = '-'
    if(kved_text == 'Realizacja projektów budowlanych związanych ze wznoszeniem budynków (4110Z)'):
        first_links.append(links)
    else:
        continue

with open('first_links.txt', 'a') as f:
    for line in first_links:
        f.write(f'{line}\n')

Вопрос задан более двух лет назад
295 просмотров

7 комментариев

Подписаться 1 Простой 7 комментариев

Алан Гибизов @phaggi Куратор тега Python

А вы его по сусалам, чтоб не выделывался.
Как хоть выделывается, с подвыподвертом или так?

Написано более двух лет назад
AWEme @AWEme

Алан Гибизов, с двумя бесконечными циклами.

Написано более двух лет назад
AnKus @AnKus Автор вопроса

Алан Гибизов, а судя по тем исключениям, что добавляю не ясно, или вам лишь бы 5 коп вставить не по делу ?!

Написано более двух лет назад
AnKus @AnKus Автор вопроса

AWEme, в данном случае они погоду не делают

Написано более двух лет назад
Алан Гибизов @phaggi Куратор тега Python

AnKus, добавленные вами перехваты исключений могут ведь и ошибочно быть добавлены, я же не знаю, что там внутри происходило?

Как куратор тэга python рекомендую вам доработать вопрос, а именно:
Исправить название вопроса в соответствии с п.3.4 Регламента.
Добавить в тело вопроса подробности, которые помогут отвечающим, а именно: traceback, если таковой был; подробности о поведении программы;
как именно программа начинает выделываться (до попыток решить проблему); как именно вы пробовали решить проблему, и какие результаты получали на ваши попытки.
Также рекомендую спрятать длинные портянки кода под спойлер.

Всё это поспособствует, чтобы отвечающие не отгадывали «по линиям вашего кода», как вы пытались «бороться». И вероятность получения нужного вам ответа повысится.

Написано более двух лет назад
Алан Гибизов @phaggi Куратор тега Python

Также хорошо бы минимизировать пример, оставив лишь необходимое для воспроизведения ошибок.

Написано более двух лет назад
AWEme @AWEme

AnKus, Имеет смысл оформить код правильно

Написано более двух лет назад

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
Как добавить опцию в контекстное меню для Internet Shortcuts?
- 1 подписчик
- 22 часа назад
- 82 просмотра
1

ответ
Парсинг

+1 ещё

Средний
Есть ли бесплатная возможность получить исторические данные мемкоинов в Solana DEX?
- 1 подписчик
- вчера
- 31 просмотр
0

ответов
Python

+2 ещё

Средний
Как в Pyrogram получить id отправленного сообщения?
- 1 подписчик
- вчера
- 40 просмотров
1

ответ
Python

+1 ещё

Простой
Как распарсить смешанный тип json-данных?
- 1 подписчик
- 26 июл.
- 213 просмотров
3

ответа
Python

+1 ещё

Средний
Как «На лету» добавить клик id в готовый апк, который будет скачиваться с сайта?
- 1 подписчик
- 26 июл.
- 129 просмотров
2

ответа
Парсинг

+1 ещё

Простой
Ошибка в коде парсера Ozon, что не так?
- 1 подписчик
- 26 июл.
- 158 просмотров
0

ответов
Python

+1 ещё

Средний
Как подключить отладчик к программе на Python в Docker-контейнере?
- 1 подписчик
- 24 июл.
- 176 просмотров
1

ответ
Python

Простой
Почему не получается создать профиль в программе Dolphin{anty}?
- 1 подписчик
- 24 июл.
- 81 просмотр
1

ответ
Python

Простой
Как совместить два .pdf файла?
- 1 подписчик
- 22 июл.
- 250 просмотров
0

ответов
Python

+1 ещё

Простой
Не доходит колбэк в колбекобработчик, как можно решить эту проблему?
- 1 подписчик
- 22 июл.
- 140 просмотров
1

ответ
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

А вы его по сусалам, чтоб не выделывался.
Как хоть выделывается, с подвыподвертом или так?
Алан Гибизов, с двумя бесконечными циклами.
Алан Гибизов, а судя по тем исключениям, что добавляю не ясно, или вам лишь бы 5 коп вставить не по делу ?!
AWEme, в данном случае они погоду не делают
AnKus, добавленные вами перехваты исключений могут ведь и ошибочно быть добавлены, я же не знаю, что там внутри происходило?

Как куратор тэга python рекомендую вам доработать вопрос, а именно:
Исправить название вопроса в соответствии с п.3.4 Регламента.
Добавить в тело вопроса подробности, которые помогут отвечающим, а именно: traceback, если таковой был; подробности о поведении программы;
как именно программа начинает выделываться (до попыток решить проблему); как именно вы пробовали решить проблему, и какие результаты получали на ваши попытки.
Также рекомендую спрятать длинные портянки кода под спойлер.

Всё это поспособствует, чтобы отвечающие не отгадывали «по линиям вашего кода», как вы пытались «бороться». И вероятность получения нужного вам ответа повысится.
Также хорошо бы минимизировать пример, оставив лишь необходимое для воспроизведения ошибок.
AnKus, Имеет смысл оформить код правильно

Answer 1 · 2022-08-15 22:14:33

Dimonchik @dimonchik2013

non progredi est regredi

прокси тебу нужен, начальник
или хотя бы таймауты

там простейший отсекалка стоит

Ответ написан более двух лет назад

1 комментарий

Вываливается парсинг. Connect error. Как исправить?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт