Всем привет.
Задача: Собрать все ссылки на странице href=["\']?([^"\'>]+)["\'] - вот такой регуляркой я собираю их все, но туда попадают и стили и скрипты.
Как можно модифицировать ее, чтоб исключить все ненужное?
Надо было что-то типа такого отрицания: (?!css|js|png|ico|xml) ~href=['"]/*((?:(?!css|js|png|ico|xml)\S)+)['"]~
В примере по ссылке в первой группе вы получите чистые url'ы (т.е. без лишних символов)