Почему html.Parser выдаёт ошибку?

Question

Yaroslav Rsx @RosesX

Python

Почему html.Parser выдаёт ошибку?

Вот код самого парсера:

import requests
from bs4 import BeautifulSoup as BS


s = requests.Session()

auth_html = s.get('https://forum.excalibur-craft.ru/login/')
auth_bs = BS(auth_html.content, 'html.parser')
csrf = auth_bs.select('input[name=csrfKey]')[0]['value']

payload = {
	'csrfKey' : csrf,
	'auth' : 'hekoso524@oriwijn.com',
	'password' : 'malaki63',
	'remember_me' : 1
}

answ = s.post('https://forum.excalibur-craft.ru/?_fromLogout=1&_fromLogin=1', data = payload)
anw_bs = BS(answ.content, 'html.parser')

max_page = 226
pages = []

r = requests.get("https://forum.excalibur-craft.ru/forum/14-флудилка/")
html = BS(r.content, "html.parser")

for el in html.select(".ipsDataList "):
	title = el.select(".ipsDataItem_meta a")
print( title[0].text )

Вот текст ошибки:

Traceback (most recent call last):
  File "C:\Users\kkk22\OneDrive\Рабочий стол\123.py", line 9, in <module>
    csrf = auth_bs.select('input[name=csrfKey]')[0]['value']
IndexError: list index out of range

Вопрос задан более трёх лет назад
717 просмотров

3 комментария

Подписаться 1 Простой 3 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- вчера
- 143 просмотра
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- вчера
- 255 просмотров
1

ответ
Python

Простой
Какие есть удобные API для генерации картинок через AI?
- 2 подписчика
- 20 окт.
- 160 просмотров
1

ответ
Python

Простой
Дублирование логов в python logging?
- 3 подписчика
- 19 окт.
- 256 просмотров
1

ответ
Python

+1 ещё

Средний
Как сделать чтоб аккаунт писал при подписке на канал?
- 1 подписчик
- 16 окт.
- 159 просмотров
0

ответов
Python

+1 ещё

Простой
Какие есть простые легковесные LLM для локального использования?
- 2 подписчика
- 14 окт.
- 605 просмотров
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 133 просмотра
0

ответов
Python

+1 ещё

Простой
FastAPI Prometheus_fastapi_instrumentator где мне следует разместить?
- 1 подписчик
- 09 окт.
- 147 просмотров
1

ответ
Python

+1 ещё

Простой
Пытаюсь пропустить число 10 двумя способами.(правильный второй код) Почему эти два кода дают разный результат?
- 1 подписчик
- 09 окт.
- 564 просмотра
2

ответа
Python

+2 ещё

Простой
В каком слое DTO объект преобразовывать в словарь перед сохранением в БД?
- 1 подписчик
- 08 окт.
- 149 просмотров
2

ответа
Показать ещё Загружается…

Python Developer

Strikt

от 100 000 до 150 000 ₽

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

Код предназначен для того что бы вытянуть ники игроков с сайта
Yaroslav Rsx, В самой ошибке написано что индекс списка вне диапазона.
Я как будто не видел что там написанно?

Answer 1 · 2020-11-23 15:29:26

Yaroslav Rsx, добрый день!
Вы немного усложнили способ получения активных пользователей ветки этого сайта.
Страницы форума доступны любому, в том числе незарегистрированному, пользователю.
Нет смысла логиниться.
Посмотрите мой код, запустите.

import requests
from bs4 import BeautifulSoup
from pprint import pprint


# %%time

list_nicknames = []

url = r"https://forum.excalibur-craft.ru/forum/14-флудилка/?page="

for i in range(1,228):
    r = requests.get(url+str(i))
    soup = BeautifulSoup(r.content)

    all_rows = soup.find_all("div", {"class": "ipsDataItem_meta"})
    for el in all_rows:
        if el.find("a") is not -1 and el.find("a") is not None:
            nickname = el.find("a").get_text()
            list_nicknames.append(nickname)

uniq_nicknames = set(list_nicknames)
print(len(list_nicknames)) # 5671 пользователя
print(len(uniq_nicknames)) # 2126 уникальных
# pprint(uniq_nicknames)

Успехов в парсинге)

UPD:
Код выше тестировался в Google.Colab - ошибок не было.
Интерпретатор в связке с PyCharm или SiblimeText возвращает ошибку.

В этом случае стоит попробовать так:

import requests
from bs4 import BeautifulSoup
from pprint import pprint


list_nicknames = []

url = r"https://forum.excalibur-craft.ru/forum/14-флудилка/?page="

for i in range(1,228):
    r = requests.get(url+str(i))
    soup = BeautifulSoup(r.content, "html.parser")

    all_rows = soup.find_all("div", {"class": "ipsDataItem_meta"})
    for el in all_rows:
        if el.find("a") != -1 and el.find("a") is not None:
            nickname = el.find("a").get_text()
            list_nicknames.append(nickname)

uniq_nicknames = set(list_nicknames)
print(len(list_nicknames)) # 5671 пользователя
print(len(uniq_nicknames)) # 2126 уникальных
# pprint(uniq_nicknames)

Почему html.Parser выдаёт ошибку?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт