Как очистить html таблицу полученную из excel от мусора?

Нужно удалить классы, инлайн стили, атрибуты тегов.
Оставить только контент + гиперссылки.
Пробовал онлайн инструменты - те, что более менее подходили почему то вместе с мусором удаляли ссылки, а они мне нужны
  • Вопрос задан
  • 3204 просмотра
Решения вопроса 1
@entermix
Удалить все ненужное регулярными выражениями например
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
Vyad
@Vyad Автор вопроса
Всем спасибо за участие! Разобрался:

<?php
    $content = file_get_contents('table.html');

    $table = preg_replace("/<([a-z][a-z0-9]*)(?:[^>]*(\shref=['\"][^'\"]*['\"]))?[^>]*?(\/?)>/i",'<$1$2$3>', $content);
?>
<body>
    <?=$table?>
</body>
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы