Почему парсит только первые ники?

Question

kpkkk423 @kpkkk423

Python

Почему парсит только первые ники?

Почему у меня парсит только первый ник на все 100 страниц хоть должен был парсить по 15 на каждой странице

import requests
from bs4 import BeautifulSoup
from lxml import html

ses = requests.Session()
data = {"name": "vaseaxxx", "password": "vaseaxxx"}

auth = ses.post("http://mrush.mobi/login", data=data)

#print(auth.text)

for i in range(1,100):
  mrush = open('ParsNick.txt','a')
  html_text = ses.get(f"http://mrush.mobi/best?pvp=0&page={i}").text
  #print(html_text)
  soup = BeautifulSoup(html_text, 'html.parser')
  names = soup.find_all('table', {"class": "cntr wa mlra"})
  for name in names:
    nick = name.a.text
    print(nick)
    mrush.write(nick+'\n')
  mrush.close()

Вопрос задан более трёх лет назад
123 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Решения вопроса 1

5 комментариев

kpkkk423 @kpkkk423 Автор вопроса

На счёт ещё одного параметра я так понял вы про такой c3990103075= получилось найти его ток почему-то не очень помогает блокируется ip(

Написано более трёх лет назад
Сергей Карбивничий @hottabxp Куратор тега Python

kpkkk423, Там местоположение каждый раз меняется. Поищите в html коде "я не робот", там несколько штук, и везде параметры разные. Нужно узнать какой по счёту используется для текущей авторизации.

Написано более трёх лет назад
kpkkk423 @kpkkk423 Автор вопроса

Сергей Карбивничий, да нашли уже обход как думаете блок ип и за того что быстро идёт много потом ?

Написано более трёх лет назад
Сергей Карбивничий @hottabxp Куратор тега Python

kpkkk423, Не знаю. А как вы поняли что блок по ip. Там так написано?

Написано более трёх лет назад
kpkkk423 @kpkkk423 Автор вопроса
На счёт рабочий код ошибка даёт

names = table.find_all('a', class_='lwhite') AttributeError: 'NoneType' object has no attribute 'find_all'
Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 150 просмотров
0

ответов
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 213 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 146 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 112 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 250 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 135 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 140 просмотров
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 141 просмотр
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 259 просмотров
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 426 просмотров
1

ответ
Показать ещё Загружается…

Backend developer (Python, FastAPI)

BCraft

До 4 000 $

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Answer 1 · 2020-03-26 17:05:46

1) Вы ищете таблицы с классом 'cntr wa mlra', а нужно таблицу.
2) Уже в найденной таблице искать (как вариант) все теги 'a' с классом 'lwhite'

table = soup.find('table', {"class": "cntr wa mlra"})
names = table.find_all('a',class_='lwhite')
for name in names:
	nick = name.text
	print(nick)

3) Вы их уже задолбали, они поставили хитрую защиту от таких скриптов. Нужно делать задержки при отправке запросов.

Насчет защиты - там теперь при авторизации нужно передавать еще один параметр(с пустым значением) с рамдомным именем. Но просто перед авторизацией сделать get запрос и вытащить данный параметр просто так не получится, там немного хитрее всё это сделано.

Рабочий код(куки скопировал из браузера):

import requests
from bs4 import BeautifulSoup
from lxml import html
import time

cookies = {'PHPSESSID':'c3a1cde86c8c8c9f0e3877403ad4935e.1585230344.54638591'}

headers = {'user-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:72.0) Gecko/20100101 Firefox/72.0'}

for i in range(1,6):
  mrush = open('ParsNick.txt','a')
  html_text = requests.get(f"http://mrush.mobi/best?pvp=0&page={i}",cookies=cookies,headers=headers).text

  soup = BeautifulSoup(html_text, 'html.parser')
  table = soup.find('table', {"class": "cntr wa mlra"})
  names = table.find_all('a',class_='lwhite')
  for name in names:
    nick = name.text
    print(nick)
    mrush.write(nick+'\n')
  mrush.close()
  time.sleep(1)

Answer 2 · 2020-03-26 15:11:59

Dimonchik @dimonchik2013

non progredi est regredi

потому что надо пагинировать

Ответ написан более трёх лет назад

2 комментария

Почему парсит только первые ники?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт