Как в PHP извлечь содержимое тега, используя регулярные выражения?

Question

romanm94 @romanm94

Как в PHP извлечь содержимое тега, используя регулярные выражения?

Столкнулся со следующей проблемой: занимаясь парсингом сайта (HTML DOM Parser) оказался в неприятной ситуации с извлечением информации из тега.
Имеется массив $el, содержащий следующие строки:

<a href="test">TEST1</a>
<span id="info">INFO</span>
<a href="test2">TEST2</a>

Мне следует просто вывести содержимое тегов. Сделал следующим образом:

$txt = $el->innertext;
preg_match ( '/<a[^>]+?[^>]+>(.*?)<\/a>/i' , $txt , $matches); 
$info['TEST1:'] = str_replace("TEST1:","",$matches[1]);
preg_match ( '/<a[^>]+?[^>]+>(.*?)<\/a>/i', $txt , $matches); // не знаю как вывести содержимое второго тега <a></a>
$info['TEST2:'] = str_replace("TEST2:","",$matches[1]);
preg_match ( '/<span[^>]+?[^>]+>(.*?)<\/span>/i' , $txt , $matches);
$info['INFO:'] = str_replace("INFO:","",$matches[1]);

Вынести TEST1 и INFO удалось, а TEST2, к сожалению, нет. Как это можно сделать (вынести содержимое второго тега <a></a>?

Так же есть массив, который содержит:

<span class="date">01 декабря 2013 — 02:20</span> // например

Как вынести отдельно дату (до тире), и время (после), используя регулярные выражения?

Вопрос задан более трёх лет назад
20972 просмотра

Комментировать

Подписаться 6 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее

Решения вопроса 2

Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 92 просмотра
1

ответ
PHP

Простой
PDO не видит внутри функции?
- 1 подписчик
- 25 апр.
- 201 просмотр
2

ответа
PHP

Средний
Как подключиться к серверу PHP и чтобы отображались исполнители?
- 1 подписчик
- 24 апр.
- 220 просмотров
3

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 264 просмотра
2

ответа
PHP

Простой
Не работает яндекс ссылка прямая?
- 1 подписчик
- 07 апр.
- 204 просмотра
1

ответ
PHP

Простой
Почему слетает сайт при загрузке обработчика?
- 1 подписчик
- 02 апр.
- 229 просмотров
1

ответ
JavaScript

+2 ещё

Средний
Авторизация вконтакте как настроить?
- 2 подписчика
- 26 мар.
- 381 просмотр
1

ответ
PHP

Простой
СТРОКА — где искать ее истоки на сайте?
- 1 подписчик
- 11 мар.
- 382 просмотра
2

ответа
PHP

Простой
Есть ли такая функция сравнения?
- 2 подписчика
- 09 мар.
- 328 просмотров
1

ответ
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 4 подписчика
- 05 мар.
- 1015 просмотров
4

ответа
Показать ещё Загружается…

PHP-разработчик

Остров Сокровищ

от 15 000 до 250 000 ₽

Backend Developer (PHP, Yii2)

Студворк • Москва

от 150 000 ₽

Программист PHP

Базис-Центр • Коломна

от 70 000 до 250 000 ₽

Answer 1 · 2013-12-01 08:35:56

$doc = new DomDocument('1.0', 'utf-8');
$doc->loadXML('<body>'.$txt.'</body>');
$xp = new DomXPath($doc);

foreach ($xp->query('//a') as $anode) {
    echo $anode->nodeValue;
};

foreach ($xp->query('//span[@class="date"]') as $date_node) {
    list($date, $time) = explode(' - ', $date_node->nodeValue);
};

Answer 2 · 2013-12-01 01:43:28

Если у вас есть проблема, и вы собираетесь решать ее с использованием регулярных выражений, то у вас есть две проблемы.
Боян, но всегда в тему.

preg_match_all ( '/<a[^>]+?[^>]+>(.*?)<\/a>/i' , $txt , $matches); 
$info['TEST1:'] = str_replace("TEST1:","",$matches[1][0]);
$info['TEST2:'] = str_replace("TEST2:","",$matches[1][1]);
preg_match ( '/<span[^>]+?[^>]+>(.*?)<\/span>/i' , $txt , $matches);
$info['INFO:'] = str_replace("INFO:","",$matches[1]);
print_r($info);

Для разбиения даты все же используйте explode(). Не надо пихать регэкспы везде и всюду.

Answer 3 · 2013-12-01 01:23:45

Алексей @ScorpLeX

strip-tags

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2013-12-01 06:09:29

Почему бы не использовать уже готовые решения?
например simplehtmldom.sourceforge.net/ позволяет получать все что нужно jquery like запросами

Как в PHP извлечь содержимое тега, используя регулярные выражения?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт