Почему код написанный на python работает некорректно?

Question

Sanyx @Sanyx

Python

Почему код написанный на python работает некорректно?

Есть такой сайт https://cs-ms-monitoring.ru/all-servers/ на каждой странице список IP адресов игровых серверов. Мне нужно написать код который будет парсить ip и записывать их в файл на компьютере. Я написал вот такой код, все работает и записует, однако, парсит только первую страницу. Почему не парсит остальные страницы?

from bs4 import BeautifulSoup
import  requests

cout_page = 1
while cout_page < 8:
 content = "https://cs-ms-monitoring.ru/all-servers/page/" + str(cout_page)  +  "/"
 req = requests.get(content)
 cout_page += 1
 soup = BeautifulSoup(req.text, "lxml")
 tage = []
 root = soup.findAll('span',{'class':'label label-default'})

for i in root:
 tage.append(i.text)

file = open("base.txt", "w")
for files in tage:
 file.write(files)
 file.write("\n")
file.close()

Вопрос задан более года назад
133 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Решения вопроса 2

Комментировать

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 157 просмотров
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 272 просмотра
1

ответ
Python

Простой
Какие есть удобные API для генерации картинок через AI?
- 2 подписчика
- 20 окт.
- 178 просмотров
1

ответ
Python

Простой
Дублирование логов в python logging?
- 3 подписчика
- 19 окт.
- 263 просмотра
1

ответ
Python

+1 ещё

Средний
Как сделать чтоб аккаунт писал при подписке на канал?
- 1 подписчик
- 16 окт.
- 163 просмотра
0

ответов
Python

+1 ещё

Простой
Какие есть простые легковесные LLM для локального использования?
- 2 подписчика
- 14 окт.
- 615 просмотров
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 135 просмотров
0

ответов
Python

+1 ещё

Простой
FastAPI Prometheus_fastapi_instrumentator где мне следует разместить?
- 1 подписчик
- 09 окт.
- 149 просмотров
1

ответ
Python

+1 ещё

Простой
Пытаюсь пропустить число 10 двумя способами.(правильный второй код) Почему эти два кода дают разный результат?
- 1 подписчик
- 09 окт.
- 566 просмотров
2

ответа
Python

+2 ещё

Простой
В каком слое DTO объект преобразовывать в словарь перед сохранением в БД?
- 1 подписчик
- 08 окт.
- 150 просмотров
2

ответа
Показать ещё Загружается…

Python Developer

Strikt

от 100 000 до 150 000 ₽

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

Answer 1 · 2024-08-14 13:59:17

парсит только первую страницу

Наверное, не первую, а последнюю? У вас на каждую итерацию while массив найденных элементов затирается и используется потом только данные последней страницы.

Отступы у for i in root: нужно поправить - эта логика должна выполняться внутри цикла while.
А tage = [] нужно из цикла, наоборот, вынести. Ну а лучше вообще эту переменную убрать и писать в файл прямо внутри while.

Answer 2 · 2024-08-14 14:03:25

Знаю, что быдло код, просьба не критиковать , так как я только учась! :)

А как Вы научитесь, если Вас не будут критиковать?

Почему не парсит остальные страницы?

Вас не смущает, что root находится в другой области видимости?

while cout_page < 8:
  # ...
  root = soup.findAll('span',{'class':'label label-default'})

for i in root:
  tage.append(i.text)

Вот так работает:

import requests
from bs4 import BeautifulSoup

start_page = 1
last_pages = 8

tags = []

for page in range(start_page, last_pages + 1):
    url = f"https://cs-ms-monitoring.ru/all-servers/page/{page}/"
    res = requests.get(url)

    if res.status_code == 200:
        soup = BeautifulSoup(res.text, "lxml")
        root = soup.find_all('span', {'class': 'label label-default'})
        tags.extend([tag.text for tag in root])
    else:
        print(f"Ошибка на странице {page}")

with open("base.txt", "w") as file:
    for tag in tags:
        file.write(tag + "\n")

КартинкО

Почему код написанный на python работает некорректно?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт