Как исключить ссылки из текста с помощью regex?

Нужно с помощью одного регулярного выражения с помощью javascript найти в тексте все слова, но пропустить то, что находится в квадратных скобках и пропустить ссылки. Слова будут использоваться для проверки правописания. Использовать можно только одно регулярное выражение.

Тестовый текст:

Lorem ipsum dolor sit amet, consectetur adipiscing elit,
sed do eiusmod tempor incididunt ut labore et dolore magna
aliqua. Ut enim ad minim veniam, quis nostrud exercitation
ullamco laboris nisi ut aliquip ex ea commodo consequat.
Duis aute irure dolor in reprehenderit in voluptate velit
esse cillum dolore eu :fugiat: nulla pariatur. Excepteur sint
occaecat :cupidatat [non] proident:, sunt in culpa qui officia
deserunt mollit anim id est laborum.

abcdefghijklmnopqrstuvwxyz [ABCDEFGHIJKLMNO] PQRSTUVWXYZ
0123456789 _+-.,!@#$%^&*();\/|<>"'
12345 -98.7 3.141 .6180 9,000 +42
555.123.4567    +1-(800)-555-2468
foo@demo.net    <bar.ba@test.co.uk>
www.demo.com    {http://foo.co.uk/  }  
[https://marketplace.visualstudio.com/ite]   ms?itemName=chrmarti.regex
https://github.com/chrmarti/vscode-regex asdfasdf

Допустим, что можно найти все слова с помощью
/\b[^\s]+\b/g
Допустим, что можно найти текст в квадратных скобках с помощью
/[^\[]*\]/g
Если их объединить, то получается
/(\b[^\s]+\b)(?!([^\[]*\]))/g
Если я правильно понимаю, то вторая группа фильтрует первую. Для ссылок я набросал выражение
/\b(http)[^\s]+\b/g
По аналогии я пытаюсь добавить его третьей группой с negative lookagead, чтобы первая группа искала все слова, вторая удаляла оттуда всё, что в скобках, а третья убирала ссылки. Получается
/(\b[^\s]+\b)(?!([^\[]*\]))(?!(\bhttp[^\s]+\b))/g
Но ссылки не убираются. Работают ли так группы, как я хочу? Или я иду в неверном направлении?
  • Вопрос задан
  • 512 просмотров
Решения вопроса 1
lidacriss
@lidacriss
wtf
/(\b[^\s]+\b)(?!([^\[]*\]))/g
Если я правильно понимаю, то вторая группа фильтрует первую

Откройте для себя онлайн редакторы регулярок
https://regex101.com/r/jB5JrR/1
да и вообще лучше почитайте мануалы по регуляркам :)

ваша вторая "группа" не группа, а отрицательное вперед смотрящее
т.е. вы находите "слова", после которых нет того, что в вашей "группе" (?!([^\[]*\]))

По аналогии я пытаюсь добавить его третьей группой с negative lookagead, чтобы первая группа искала все слова, вторая удаляла оттуда всё, что в скобках, а третья убирала ссылки. Получается
/(\b[^\s]+\b)(?!([^\[]*\]))(?!(\bhttp[^\s]+\b))/g

это не работает так, как вы описали)
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
Wanted. Санкт-Петербург
До 450 000 ₽
Wanted. Санкт-Петербург
До 120 000 ₽
Wanted. Санкт-Петербург
До 100 000 ₽
25 нояб. 2024, в 14:20
1500 руб./за проект
25 нояб. 2024, в 13:53
150000 руб./за проект
25 нояб. 2024, в 13:48
1500 руб./в час