Добрый день, по ходу копания одного парсера возник практический вопрос.
Вот регэксп:
/<strong>\s*(?:<img.*?\/?>)?(.*)<\/strong>/
(?:<img.*?\/?>)
- эта часть означает какое-либо изображение перед текстом. Оно может быть, его может не быть. Если изображение отсутствует текст парсится нормально. Но проблема в том, что если изображение есть, оно попадает не
(?:<img.*?\/?>)
сюда, а в блок с текстом
(.*)
. Как можно исправиль данный регэксп?
Пример объекта парсинга
<strong><img src="http://www.site.de/images/stories/galleries/reviews/ololo.jpg" alt="ololo" style="margin: 10px; float: left;" height="100" width="100" /> Пока космические корабли бороздят просторы северного ледовитого океана...</strong>