При парсинге html(сайтов) на Python-e c использованием библиотеки указанной в сабже очень "спотыкаюсь" нанеудобную работу с тегами после
DOWNLOAD_URL = 'http://super-mega-program.org/download.html'
html_page = urlopen(self.DOWNLOAD_URL)
soup = BeautifulSoup(html_page, 'html.parser')
css_selector = 'ТУТ ОЧЕНЬ СЛОЖНЫЙ СТРИНГ'
versions_box = soup.select(css_selector)[0]
p_tags = versions_box.findAll('p', {'class': 'editions'})
ver1 = p_tags[0].i.getText().split()[1]
ver2 = p_tags[5].i.getText().split()[1]
Мне тут не нравится то, что я вынужден вызывать findAll() . Я бы хотел что-нибудь такое:
versions_box.p[0].i.text.split()[1]
versions_box.p[5].i.text.split()[1]
Может я чего-то не знаю и есть более удобные способы работы, чем-то что в этом примере?