Точно не знаю покажет тут или нет, в общем между буквами a и b есть символ: ab
твиттер на него ругается. Скорее всего пришло с какого doc-документа.
Пока сделал просто вырез через str_replace, но может есть что более правильное?
Может есть способ как вырезать такой мусор?
перед показом юзаем html_entity_decode и htmlspecialchars
Не совсем понятно какие именно символы вы собираетесь вырезать. Невидимых и трудноразличимых символов довольно много, обычно проще оставить "правильные", удалив все остальное.
Не совсем понятно какие именно символы вы собираетесь вырезат
Что приходит с разные текстовых редакторов (word) и что не показывается или криво показывается. Или мешает поделиться такой ссылкой/текстом в соц сетях