Необходимо преобразовать в массив HTML верстку по такой форме:
<p>Какой-то текст. <strong>Возможно жирный.</strong></p>
<p>И не только один параграф, а очень много!!!</p>
Должно в итоге получиться следующие:
Array
(
[0] => <p>
[1] => Какой
[2] => -
[3] => то
[4] => // пробел, но можно заменить на символ, который в дальнейшем будет обозначать пробел
[5] => текст
[6] => .
[7] => // пробел, но можно заменить на символ, который в дальнейшем будет обозначать пробел
[8] => <strong>
[9] => Возможно
[10] => // пробел, но можно заменить на символ, который в дальнейшем будет обозначать пробел
[n] => ...
)
Есть вот такой вариант, но есть проблемы с закрывающими тегами
</
они в коде идут как ошибка + появляются откуда-то пустые элементы массива (не пробелы, а именно пустые элементы внутри тегов).
preg_match_all("/([а-яА-ЯЁёa-zA-Z0-9]*|[.,-_!?;:'\(\)\"]*)/u", $content, $words);
Array
(
[0] =>
[1] => <
[2] => p
[3] =>
[4] => >
[5] => Какой
[6] =>
[7] => -
[8] => то
[9] =>
[10] => текст
[11] =>
[12] => .
[13] =>
[14] =>
[15] => <
[16] => strong
[17] =>
[18] => >
[19] => Возможно
[20] =>
[21] => жирный
[22] =>
[23] => . strong
[25] =>
[26] => > p
[28] =>
[29] => >
[30] =>
[31] =>
[32] =>
[33] => <
[34] => p
[35] =>
[36] => >
[37] => И
[38] =>
[39] => не
[40] =>
[41] => только
[42] =>
[43] => один
[44] =>
[45] => параграф
[46] =>
[47] => ,
[48] =>
[49] => а
[50] =>
[51] => очень
[52] =>
[53] => много
[54] =>
[55] => !!! p
[57] =>
[58] => >
[59] =>
)