@popy
Cтудент

Почему при парсинге поисковой выдачи яндекса парсятся не все данные?

Подскажите пожалуйста, дали задание из поисковой выдачи получить координаты определенного места, начинаю парсить поисковую выдачу яндекса:
5cfcdeadbcc3b394490980.png
вот таким образом:
url = 'http://yandex.ru/yandsearch?text=' + city.lower() + ' широта долгота'
    headers = {'User-Agent': 'Mozilla/7.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
    r = req.get(url, headers=headers)
    
    with open('./test.html', 'wb') as output_file:
        output_file.write(r.text.encode('utf-8'))

    text = ''
    with codecs.open('./test.html', "r", "utf_8_sig" ) as file_obj:
        for i in file_obj:
            text += i

    soup = BeautifulSoup(text)
    movie_link = soup.find_all('span', {'class': 'extended-text__short'})
    
    strr = []
    for i in range(len(movie_link)):
        strr.append(str(movie_link[0]))
    st = re.sub(r"[^\sа-яА-ЯёЁ0-9,.°\"'-]",'',' '.join(strr)).lower()
    print(st)


но в итоге не получаю нужные данные. Выводит всю инфу кроме нужной
5cfcdf0d729d0826849601.png

Как получить нужные данные ?)
Заранее спасибо)
  • Вопрос задан
  • 190 просмотров
Пригласить эксперта
Ответы на вопрос 1
@viking1013
Размести плез полный код. Не видно некоторых параметров.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы