Вадим Соловьёв, [A-Za-z].*
Работает так: если найден символ в диапазоне A-Za-z, то он и всё до конца строки удаляется.
Так что может плохо работать на строках начинающихся с цифр, например.
Тогда лучше подойдут такие регэкспы: .*[А-Яа-яЁё].* и .*[A-Za-z].*
они удалят полностью строки что содержат хоть один символ из диапазона.
Огромное спасибо. А возможно к этим регулярным выражениям добавить преобразование лишних строк в одну как это делает яндекс переводчик? Напишите email своего пейпала, кину вам донат.
Думаю можно похоже:
Нужно исправить регэкспы чтобы удалялся ещё и перенос строк так: .*[А-Яа-яЁё].*\r\n и .*[A-Za-z].*\r\n
Или можно удалить переносы строк более двух подряд: найти \r\n(\r\n)+ и заменить на \r\n\r\n
* примечание: в виндовом режиме CR LF перенос состоит из двух сиволов \r\n, но если документ у вас в LF то для переноса используется только один символ \n, тогда во всех регэкспах нужно удалить\r чтобы они работали. Режим можно видеть в строке состояния снизу справа.
Вадим Соловьёв, видимо лишние пустые строки придётся убирать заменой \n\n(\n)+ на \n\n. Но как минимум в начале и конце может остаться по лишней строке.