Задать вопрос
Ответы пользователя по тегу Искусственный интеллект
  • Какой из шрифтов плохо поддаётся OCR, но при этом сносоно читается человеком?

    AxisPod
    @AxisPod
    Ну в общем к чему я пришел, когда занимался взломом каптч, то всякие шумы и контраст вырезаются легко (как написано выше), всякие варианты с ниверсией цвета тоже ничего не дает. Более или менее действенные варианты:
    — это символы с разрывами, по типу старых трафаретов, где ручкой буковки и циферки рисовали, при этом разрывы должны быть сопоставимы с размерами букв и пробелов (в смысле пара пикселей для шрифта в 72pt ничего вообще не даст, должно быть пропорционально).
    — это наложение букв друг на друга, но начинает страдать читабельность.
    — это рамка символов, т.е. внутренности символа имеют цвет фона и видна только 1 пиксельная рамка, а если эта рамка еще представляет из себя пунктирную линию, то большинство OCR снесет эти буквы как шум
    — это сильно искаженные символы, если волны еще как-то нормально можно востановить, хотя и потребуется индивидуальный подход, то искажения (не помню как в фотошопе называется), взять прямоугольный полигон под символ и растянуть несколько вершин непропорционально, чем-то похоже на псевд 3д преобразование, буква растянута непропорционально OCR уже начинает обламываться.

    Но это все для капчи.
    Ответ написан
    Комментировать