Регулярные выражения не подходят для анализа html.
Даже в очень простых случаях они будут неоправданно сложными. Страницу нужно предварительно разобрать на составные элементы, разобрать и отфильтровать их типы (атрибут, текст, теги,..) и уже по этому разбору что либо искать.
Настоятельно рекомендую готовые анализаторы html, они есть подо все популярные и не очень языки и фреймворки. Например для php -
штатные или рекомендую
simple_html_dom, код будет простым, работать будет очень быстро, все встроено в php или простой include одного файла..