@leistolz

Как парсить строку названия стрима с твича?

Имеется кусок html кода профиля стримера, нужно спарсить строку из него.
<!DOCTYPE html>
<html lang='ru' style='overflow: hidden;' xml:lang='ru' xmlns:fb='http://www.facebook.com/2008/fbml' xmlns:og='http://opengraphprotocol.org/schema/' xmlns='http://www.w3.org/1999/xhtml'>
<head>
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8" />
<title>Twitch</title>
<meta content='IE=edge,chrome=1' http-equiv='X-UA-Compatible'>
<meta content='app-id=460177396, app-argument=twitch://open' name='apple-itunes-app'>
<meta content='Twitch' name='description'>
<link href='/favicon.ico' rel='shortcut icon' type='image/x-icon'>
<meta content='general' name='rating'>
<link href='android-app://tv.twitch.android.app/twitch/open?channel=dorofeus' rel='alternate'>
<link href='ios-app://460177396/twitch/channel/dorofeus' rel='alternate'>
<meta content='nfsZd38ZV83T6MdjAsLhwdcQHPT3HkidcTELZkVxE3k' name='google-site-verification'>
<link href='https://plus.google.com/115463106831870703431' rel='publisher'>
<meta content='Twitch' property='og:site_name'>
<meta content='161273083968709' property='fb:app_id'>
<meta content='dorofeus' property='og:title'>
<meta content='Псевдоинтеллектуальный стрим' property='og:description'>
<meta content='https://static-cdn.jtvnw.net/jtv_user_pictures/dorofeus-profile_image-1a23835371d8ff70-600x600.jpeg' property='og:image'>
<meta property='og:url'>
<meta content='video.other' property='og:type'>
<meta content='http://www-cdn.jtvnw.net/swflibs/TwitchPlayer.swf?channel=dorofeus&playerType=facebook' property='og:video'>
<meta content='https://www-cdn.jtvnw.net/swflibs/TwitchPlayer.swf?channel=dorofeus&playerType=facebook' property='og:video:secure_url'>
<meta content='application/x-shockwave-flash' property='og:video:type'>
<meta content='378' property='og:video:height'>
<meta content='620' property='og:video:width'>


А именно нужно "Псевдоинтеллектуальный стрим" находящийся в этой строке:
<meta content='Псевдоинтеллектуальный стрим' property='og:description'>


Пробовал спарсить разными способами, но не получалось, т.е название попросту не выводилось.
  • Вопрос задан
  • 1289 просмотров
Пригласить эксперта
Ответы на вопрос 2
Denormalization
@Denormalization
У твича есть API https://github.com/justintv/Twitch-API
Там вытягивается вся инфа о стриме и стримере в JSON формате.

По существу:
"Пробовал спарсить разными способами, но не получалось, т.е название попросту не выводилось"
Язык и платформу мы должны сами угадать?
Ответ написан
Комментировать
fox_12
@fox_12
Расставляю биты, управляю заряженными частицами
К примеру - как искомое вытягивается на python:
import lxml.html

data = """
ваш html код
"""

xmldata = lxml.html.document_fromstring(data)
print xmldata.xpath("//meta[@property='og:description']")[0].get('content')
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы