Как в c# получить все теги где нет вложенных тегов для html документа?

Пример html документа с вложенными тегами в тегах

<div>
   <p>text1</p>
   <p>text2<p>
</div>

или для

<div>
   <p>text1</p>
</div>
<div>
 <div>
   <p>text2</p>
 </div>
</div>


для обоих случаев нужно получить
array = {
'<p>text1<p>',
'<p>text2<p>'
}


то есть - получить все теги где нет вложенных тегов. название всех (и вложенных) тегов может быть всегда разное
  • Вопрос задан
  • 2542 просмотра
Пригласить эксперта
Ответы на вопрос 1
@MIsternik
Можно сделать через регулярные выражения, например по <\w+>\s*\w+\w+>

удобно составлять выражение тут regexr.com

string text = "твой html";
Regex optionRegex = new Regex(@"(<\w+>\s*\w+\w+>)");
MatchCollection matches = optionRegex.Matches(text);

дальше уже из matches берешь.

мог где то накосячить, проверить нет возможности сейчас.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы