Столкнулся с такой задачей. Например. Есть строка «Привет». Нужно, чтобы строки считались одинаковыми, даже если в одной строке есть английские буквы (a,e, etc.). InvariantCulture не помог. Есть простые решения?
Стандартными средствами .NET это автоматически сделать не получится. Ведь символы это разные, даже если выглядят похоже.
Простой вариант — сначала заменить все английские символы на аналогичные русские, а потом уже сравнивать строки.
Ну таблицы замены, это очевидный вариант. Надеялся, что есть какая-то чудо функция или чудо-параметр. Всё таки, составить адекватную таблицу замены — задача не очень быстрая.
Нужно перевести текст в картинку, потом либо загрузить на antigate(сервис для распознавания капчи), либо воспользоваться движком распознавания текста(рекомендую tesseract, есть примеры с EmguCV — врапер для OpenCV на c#)
Спасибо, конечно за ответ, но это невероятный костыль. Представляете себе производительность такого решения на нескольких миллионах строк. Это же ужас.
Так посмотреть, так люди заголовок только читают. Сам вопрос, правда, адекватностью тоже не блещет. Одна мысль о том, что такую чудо-функцию кто-то запихнет во фреймворк, не даст мне заснуть как минимум сегодня.
Может мне так везет, но этот функционал мне необходим всё чаще. Ибо всё же проще 1 раз написать extension для string, чем обьяснять пользователям, что буквы AP на английском для компьютера несколько отличаются от букв АР на русском и поэтому фильтр работает не правильно.