Ну в общем к чему я пришел, когда занимался взломом каптч, то всякие шумы и контраст вырезаются легко (как написано выше), всякие варианты с ниверсией цвета тоже ничего не дает. Более или менее действенные варианты:
— это символы с разрывами, по типу старых трафаретов, где ручкой буковки и циферки рисовали, при этом разрывы должны быть сопоставимы с размерами букв и пробелов (в смысле пара пикселей для шрифта в 72pt ничего вообще не даст, должно быть пропорционально).
— это наложение букв друг на друга, но начинает страдать читабельность.
— это рамка символов, т.е. внутренности символа имеют цвет фона и видна только 1 пиксельная рамка, а если эта рамка еще представляет из себя пунктирную линию, то большинство OCR снесет эти буквы как шум
— это сильно искаженные символы, если волны еще как-то нормально можно востановить, хотя и потребуется индивидуальный подход, то искажения (не помню как в фотошопе называется), взять прямоугольный полигон под символ и растянуть несколько вершин непропорционально, чем-то похоже на псевд 3д преобразование, буква растянута непропорционально OCR уже начинает обламываться.
Но это все для капчи.