Если не критично сохранение форматирования оригинала, то можно сначала удалите все лишние теги (strip_tags), а затем конвертнуть разрывы строк (nl2br) - это очень приблизительно...
Вообще же есть неплохие "чистильщики" кода, например
htmlpurifier.org