Как спарсить значение src из html кода?

Есть страница вк vk.com/kostya__wolf?z=photo107790602_343297825%2Fa...

нужно спарсить значение src из куска html кода
<img style="width: 803px; height: 565px; margin-top: 0px;" src="http://cs618331.vk.me/v618331602/10618/Ge2uPaxB4B0.jpg">


Подскажите,как это сделать?Значение src мне нужно в виде переменной
  • Вопрос задан
  • 2557 просмотров
Пригласить эксперта
Ответы на вопрос 2
@throughtheether
human after all
При помощи selenium:
from selenium import webdriver
url='https://vk.com/kostya__wolf?z=photo107790602_343297825%2Falbum107790602_00%2Frev'
xpath='//a[@id="pv_open_original"]'
browser = webdriver.Firefox()
browser.get(url)
print browser.find_element_by_xpath(xpath).get_attribute('href')
browser.quit()

При помощи requests и lxml:
import requests
import json
import lxml.html

url='https://vk.com/kostya__wolf?z=photo107790602_343297825%2Falbum107790602_00'
r=requests.get(url)
doc=lxml.html.fromstring(r.text)
search_string=url[url.find('photo'):url.find('%2F')]
xpath='//a[contains(@href, "%s")]' % search_string
src=doc.xpath(xpath)[0].get('onclick')
d = json.loads(src[src.find('{'):src.find('}}')+len('}}')])
src=d['temp']['base']+d['temp']['z_'][0]+'.jpg'
print src
Ответ написан
Комментировать
wiygn
@wiygn
борец с ветряными мельницами
Уже второй вопрос по парсингу страниц ВК, который можно было бы решить через API. Оно вам точно надо? Если нет, то https://vk.com/dev/methods
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы