Проблема с парсингом последующих страниц, в том варианте, до которого я допер, могу выдернуть только первую страницу, если использовать этот вариант pagination = soup.find('div', class_='pagination-root-2oCjZ'), то все вроде хорошо, выводится весь список страниц в html, но как их выдернуть я не понимаю... Сама страниц -
https://www.avito.ru/murmanskaya_oblast/avtomobili...
import requests
from bs4 import BeautifulSoup
def get_pages_count(html):
soup = BeautifulSoup(html, 'html.parser')
pagination = soup.find('span', class_='pagination-item-1WyVp').findNext('span')['data-marker']
if pagination:
return int(pagination[-2])
else:
return 1
def parse():
html = get_html(URL)
if html.status_code == 200:
cars = []
pages_count = get_pages_count(html.text)
for page in range(1, pages_count + 1):
print(f'Парсинг старницы {page} из {pages_count}...')
html = get_html(URL, params={"p": page})
cars.extend(get_content(html.text))
print(cars)
else:
print('Error')
parse()