Задать вопрос

Katy93 @Katy93

python

Python

Как передать параметры страницы если они записаны в url-адрес?

Делала парсер для Avito по одному видеоуроку, там автор передает параметры страницы способом GET, т.е. все что находится за знаком “?”. Но я решила использовать другой сайт, там все параметры находятся внутри url, т.е. get параметров нет.

Вот как выглядит строка:
flashhome.ru/genre_arcade_2_20_bydate.html
2 – это страница (постраничной навигации)
20 – это количество записей на странице.
Как переписать код чтобы можно было выводить записи но при этом используя классы и сессии? Вот код:

print('Content-Type: text/html; charset=utf-8\n')

import requests

from bs4 import BeautifulSoup 
#from collections import namedtuple


#InnerBlock = namedtuple('Block','title,price,currency,date,url')

class AvitoParser:
  def __init__(self):
    self.session = requests.Session()
    #Чтобы Avito не думал что мы его ломаем, а думал что мы просто браузер
    self.session.headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36',
    'Accept-Language': 'ru',
    }
    
    
  def get_page(self, page: int = None):
    # params = {
     #  'radius': 0,
      # 'user': 1,
    # }
    # if page and page > 1:
     #   params['p'] = page
        
        #cd=1&localPriority=0&
     #url = 'https://www.avito.ru/moskva/avtomobili/bmw-ASgBAgICAUTgtg3klyg'
     url = 'http://flashhome.ru/genre_arcade_'+ page +'_20_bydate.html'
     r = self.session.get(url, params=params)
     return r.text
  def get_blocks(self):
     text = self.get_page(page=2)
     print(text)
     return
     # soup = bs4.BeautifulSoup(text,'lxml')
      
      # Запрос CSS-селектора, состоящего из множества классов, производится через select
     # container = soup.select('div.item.item_table.clearfix.js-catalog-item-enum.item-with-contact.js-item-extended')
      
     # for item in container:
     #   block = self.parse_block(item=item)
      #  print(block)

def main():
   p = AvitoParser()
   p.get_blocks()
   
if __name__ == '__main__':
   main()

Вопрос задан более трёх лет назад
99 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

gedeys

Sergey @gedeys

Не совсем понятен вопрос... если просто пагинацию, то, получить количество страниц и обойти их в цикле...

Ответ написан более трёх лет назад

Комментировать

Комментировать

Katy93 @Katy93 Автор вопроса

А код можно узнать как будет выглядеть парсер с постраничной навигацией.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- вчера
- 78 просмотров
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 20 дек.
- 119 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 188 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 218 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 75 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 198 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 228 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 247 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 239 просмотров
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Самое интересное за 24 часа

Где находится убогий telegram?
- 2 подписчика
- 1 ответ
Postgres выдаёт unknown для типа char - в чём ошибка?
- 2 подписчика
- 1 ответ