Задать вопрос
@Araya

Регулярка, исключающая все вложенные файлы?

Всем привет.
Задача: Собрать все ссылки на странице
href=["\']?([^"\'>]+)["\'] - вот такой регуляркой я собираю их все, но туда попадают и стили и скрипты.
Как можно модифицировать ее, чтоб исключить все ненужное?
  • Вопрос задан
  • 163 просмотра
Подписаться 1 Простой 4 комментария
Помогут разобраться в теме Все курсы
  • Хекслет
    Python-разработчик
    10 месяцев
    Далее
  • Учебный центр IBS
    RT-001 Эксплуатация RT.DataLake
    1 неделя
    Далее
  • Хекслет
    Java-разработчик
    10 месяцев
    Далее
Решения вопроса 1
@IS-Builder
~ PHP-8 & REGEXP - This is a really powerful kit ~
Araya
чего-то типо[^\.js] пытался...

Надо было что-то типа такого отрицания: (?!css|js|png|ico|xml)
~href=['"]/*((?:(?!css|js|png|ico|xml)\S)+)['"]~
В примере по ссылке в первой группе вы получите чистые url'ы (т.е. без лишних символов)
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы