Почему не регуляркой находится кириллический домен и как учитывать домены 2 уровня?

Question

accountnujen @accountnujen

JavaScript

Почему не регуляркой находится кириллический домен и как учитывать домены 2 уровня?

Я хочу найти в тексте все ссылки и обернуть их в тег <a>. Ссылки у меня могут иметь вид: https://google.com, www.google.com, google.com, гугл.рус, поиск.гугл.рус.

На пару с chatgpt удалось добиться только вот такого результата:
[CODE]\b[A-Za-zА-Яа-яЁё]*[A-Za-zА-Яа-яЁё]+[.][A-Za-zА-Яа-яЁё]{2,}\b[/CODE]
https://regex101.com/r/4QwNjk/1

Логика была изначально такой: найти всё, что разделено точкой, так как привязываться к https или к www не хочется.

В данном случае, почему то не находится гугл.рус, хотя кириллица указана и от 2 символов...
Как захватывать всё то, что находится до точки (включая http://) - не знаю, а gpt меня не понимает.

Вопрос задан более двух лет назад
104 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Академия Эдюсон

Fullstack-разработчик на JavaScript + ИИ

11 месяцев

Далее
ProductStar × РБК

Профессия: Инженер по тестированию + ИИ

6 месяцев

Далее

Решения вопроса 2

2 комментария

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+1 ещё

Средний
Как выводить изображения в 2 или в 3 колонки в строке в зависимости от пропорций изображений?
- 1 подписчик
- 2 часа назад
- 15 просмотров
0

ответов
JavaScript

+2 ещё

Сложный
Как заставить библиотеку docs js нарисовать бордер при переносе таблицы?
- 2 подписчика
- 10 июл.
- 142 просмотра
1

ответ
JavaScript

+2 ещё

Простой
Как подстраивать размер канваса под размер страницы?
- 1 подписчик
- 01 июл.
- 125 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Не работает тень + слайдер, есть варианты?
- 2 подписчика
- 21 июн.
- 203 просмотра
1

ответ
JavaScript

Средний
Значение переменной в строку или сохранение в VK?
- 1 подписчик
- 10 июн.
- 157 просмотров
2

ответа
JavaScript

+1 ещё

Сложный
Как сделать логику post запроса покупки товара, если 1 товара не хватает — отменить покупку?
- 2 подписчика
- 10 июн.
- 234 просмотра
1

ответ
JavaScript

Средний
Как правильно вывести данные из функции в див?
- 2 подписчика
- 08 июн.
- 184 просмотра
3

ответа
JavaScript

Средний
Как перемножить значения из текстовых полей?
- 2 подписчика
- 31 мая
- 400 просмотров
1

ответ
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2472 просмотра
8

ответов
JavaScript

Простой
Почему вместо галереи owl-gallery белое пространство?
- 1 подписчик
- 18 мая
- 104 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2023-09-13 15:50:59

Aetae @Aetae Куратор тега JavaScript

Тлен

\S+\.\S+ :)

Ответ написан более двух лет назад

2 комментария

Answer 2 · 2023-09-13 15:14:04

Потому что \b и \w классы базируются на ASCII кодировке, которая не применима к unicode.

Поэтому Вам нужно что-то типа такого:

/(?:(?<=[\s,.:;"']|^)|\b)[0-9a-zа-яё]+(?:[.][0-9a-zа-яё]{2,})+(?:(?=[\s,.:;"']|$)|\b)/gi

https://regex101.com/r/Ir4Uek/4

Регулярное выражение, конечно, можно оптимизировать, но мне кажется что так наглядней

Почему не регуляркой находится кириллический домен и как учитывать домены 2 уровня?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт