@vitz84

Как из html вытащить url по определенной маске?

Всем доброго вечера и с наступающими праздниками!

Помогите решить одну задачку пожалуйста.

Суть задачи такова!
Есть сайт где стоит очень большое кол-во ссылок, но они идут как текст и мне нужно вытащить с этой странице все эти ссылки по определенной маске (для примера что бы только копировала ссылки примерно такого вида www.site.ru/parametr&parametr=1111) (т.е. что бы можно было бы задать начало допустим http;// и конец только цифры http://**********1111 , а остальные они бы не копировала.

Подскажите через какие программы или скрипты это можно реализовать?

Всем буду очень благодарен за помощь!!!
  • Вопрос задан
  • 2547 просмотров
Пригласить эксперта
Ответы на вопрос 4
Так можно: regexr.com/3db1u (по ссылке регулярка нужная вам)
Ответ написан
webinar
@webinar Куратор тега PHP
Учим yii: https://youtu.be/-WRMlGHLgRg
Есть чудесное ПО для парсинга - ContentDownloader sbfactory.ru/?p=600
Так же есть чудесная php библиотека simplehtmldom.sourceforge.net
А еще есть суровая, но рабочая штука - регулярные выражения
Ответ написан
Комментировать
ThunderCat
@ThunderCat Куратор тега PHP
{PHP, MySql, HTML, JS, CSS} developer
Ответ написан
Комментировать
@abcd0x00
Нужно выбрать все ссылки, а потом из них выбрать те, которые удовлетворяют критерию. Именно так, по частям, потому что как источник ссылок может поменяться независимо от критерия, так и критерий выбора может поменяться независимо от источника.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы