Задать вопрос
@Heavy10110

Получить total_page при парсинге?

467dfef2991241a1a76f67227e5f7530.jpg
def get_total_pages(html):
		soup = BeautifulSoup(html, 'lxml')
		pages = soup.find('div', class_='pagination-pages').find_all('a', class_='pagination-page')[-1].get('href')
		total_pages = pages.split('=')[1].split('&')[0]
		return int(total_pages)

В первом случае все понятно, мы можем просто найти последний из массива и сослаться на число в ссылке.

Но как быть, когда у нас нет кнопки последняя?
863c85132bbf4ee6a7af215290830fcf.jpg
  • Вопрос задан
  • 269 просмотров
Подписаться 3 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 2
lxsmkv
@lxsmkv
Test automation engineer
в худшем случае подбором. Как в игре угадай число. Если вы загадываете число меньше чем номер конечной страницы - страница есть, если вы берете число больше чем конечная страница - такой страницы нет.
Ответ написан
InvictusManeo
@InvictusManeo
P.A.N.D.E.M.I.C.
Вообще есть вариант как обойти заключи свой цикл в try except при не удаче просто ставишь break и все! и он перестает парсить то чего нету, это такой простой но рабочий вариант
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 дек. 2024, в 10:44
15000 руб./за проект
22 дек. 2024, в 10:12
10000 руб./за проект
22 дек. 2024, в 09:51
3000 руб./за проект