Возникла задача проверки орфограции в проекте, с последующей выгрузкой результатов вида:
[файл][строка][слово][?варианты]
Нашлись такие инструменты, как GNU Aspell, Hunspell, yaspeller
Задача состоит в проверке великого и могучего в проекте
пока остановился на Hunspell : неплохой функионал, отличные словари на основе ресерча AOT, с аффиксами
Проблема состоит в большом количествке программистских неологизмов и сокращений, которые надо как-то анализировать.
Так же неплохо бы прикрутить тезаурус и определение свойств незнакомого слова по контексту - такое нашлось только у PyMorphy
Вопрос знатокам: какие инструменты и как используете вы?
Игорь Тимошенков: да, походу ТС хочет проверять название переменных и всего остального кода на правильность написания. То есть чтобы var varieble поменяло на var variable
Андрей Саныч - мне кажется идея сама по себе ничего, но вот делать это автоматически плохая идея. Попробуйте просто IDE поменять. У меня вот в phpStorm отлично подсвечивает орфографию в названиях переменных и прочем.
firexonix - в смысле? он же показывает, ты исправляешь. Десять раз исправив одно и то же - думаю надоест и человек запомнит. Или у вас совсем не обучаемые сотрудники? Можно еще попробовать учить английский, но я так понимаю что это тоже не вариант :)
Игорь Тимошенков: проблема в том, что проект большой и с хорошим словарем встречается под несколько тысяч неизвестных слов (без учета повторов)
Первая проблема - отделить ошибки от новых слов (по частоте встречи это не всегда получается)
Вторая - обучить новым словам hunspell (уже дело техники)
Большинство людей переучивать бессмысленно - не дарить же каждому Розенталя? :)