Подскажите пожалуйста метод очистки HTML кода от тегов Word-a
Кода много, вручную не предлагать. (~10MB)
(юзер не использовал кнопку очистки от тегов в TinyMCE )
Необходимо обработать файл/базу для дальнейшего использования
пробовал: tidy, Word2003 web-filtered и еще пару инструментов, но результата ожидаемого не дало