Антон Р., скорее всего из ворда копирует в ckeditor, а при редактировании в ворде долго возится с разметкой текста, выделяя разные куски то болдом то курсивом, то объединяя блоки болда... Короче при переносе из ворд документа такая дичь с тегами это еще мелочи.
ThunderCat, тогда клиент дебил, и отлавливать такие вещи - бесполезный мартышкин труд. Завтра он начнет из экселя копировать и что ты будешь делать? Дальше всю эту херь отлавливать регулярками?
Может бизнес тебя послушается. Выгонит 30 контентщиков-дебилов (по 30 копеек штука), и наймет на их место умниц-красавиц (по стопиццот копеек штука). И разорится.
Или он таки убедит программиста сделать свою работу. Может даже не регулярками, а каким-то внятным dom-парсером.
Антон Р., Ситуации они разные бывают, конкретно по данному вопросу - у самого есть такая проблема, заказчики присылают для новостного портала док файлы, из которых лезет куча левых тегов. Причем перенос в едитор сохраняет как форматирование, так и левые теги, и тут для нормальной работы проще написать обработчик, чем учить контентщиц лазить в сырцы и вылавливать левые теги, ибо это время, причем каждый раз, дешевле потратить 1 раз время на скрипт в 2 строки, чем каждый раз объяснять и учить. И тут больше проблема того же ворда, чем писателей и контентщиков. Но надо как то работать, и в этом плане автоматизация решает, однозначно.