Правильный ответ: нельзя (невозможно надёжно) использовать регулярные выражения для парсинга html. Используйте библиотеку для html-парсинга, имеющуюся для любого языка, какой бы вы не использовали.
Я с этого начинал, но оказалось, что завист от DOM документа, в моем случае, например, есть незакрытые теги и из-за этого библиотеки не загружают DOM. Я перед регулярками уже почитал тут про "Что лучше использовать для парсинга на php" и если в моем случае работают регулярки, что в этом плохого?