@webdel

Почему не парсится?

Нужно спарсить текст новости - www.ferra.ru/ru/byt/news/2016/01/11/CES2016-Samsun...

Пробую так, должно работать, но не работает...

$page = file_get_contents("http://www.ferra.ru/ru/byt/news/2016/01/11/CES2016-Samsung-POWERbot-Turbo-Essential-Wi-Fi" . $val);

preg_match('#<div class="newsbody">([^<]+)</div>#', $page, $descr);

var_dump($descr);

В чем проблема?
  • Вопрос задан
  • 407 просмотров
Пригласить эксперта
Ответы на вопрос 2
miraage
@miraage
Старый прогер
Однако я бы предпочел парсить это дело через XML.

$html = <<<HTML
<div class="header">
    <nyan-cats></nyan-cats>
</div>
<div class="content">
    <div class="newsbody">
        some random content
        <span>HOT</span>
    </div>
</div>
HTML;

$ok = preg_match('#<div class="newsbody">(.+?)</div>#s', $html, $descr);

var_dump($ok, $descr);


int(1)
array(2) {
  [0]=>
  string(86) "<div class="newsbody">
        some random content
        <span>HOT</span>
    </div>"
  [1]=>
  string(58) "
        some random content
        <span>HOT</span>
    "
}
Ответ написан
Комментировать
@webdel Автор вопроса
Спасибо работает.

Еще такой вопрос, как отсюда парсить? Тоже написал регулярку ,но чего-то не работает.

$page = file_get_contents("http://www.3dnews.ru/926439");

preg_match('#<div class="([^<]+)" itemprop="articleBody">([^<]+)</div>#', $page, $descr);

var_dump($descr);
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы