Как вырезать из текста слово с точкой слева с помощью регулярного выражения?
Приветствую!
Можете помочь составить регулярное выражение для слов, у которых имеется точка слева, без пробела, для слов, написанных не латинскими символами?
Для чего это нужно?
Для вырезки из текста IDN-доменов.
Например такого вида:
普遍接受测试.世界
.لــــیككاثو
домен.рф
Я ваш вариант перепровирил и он вроде правильно работает, но не видит арабские символы и их пропускает.
Можете включить и арабские символы. у Арабских доменов точка слева без пробела.
spido, Во первых арабские домены у вас без левой части, соответственно не подходят под ваше условие в вопросе( по этому и не работает), во вторых - все это уже тянет на задание.
ThunderCat, арабский домен так был записан в документе по доменам, я так его и написал. В вопросе есть три типа доменов. Я подумал, что это слишком маленький вопрос для задания.
Латинские символы с точкой тоже вырежет?
Нужно, чтобы латинские символы с точкой не пострадали.
Используя ваш вариант, домен habr.com будет вырезан из текста. А это не входит в задачу.