Парсер URL из списка. И выделение url с заданным элементом?
Привет! У меня есть список url, которые хотел бы проверить по некоторым критериям. И задача вот в чем
нужно из загруженного списка url найти те url, в исходном коде которых, есть картинка, которая спрятана
Сергей Карбивничий, допусти у меня есть одностраничник, в исходном коде которого, есть какой0либо элемент, например картинка.
Допустим найти картинки в исходном коде пары URL руками легко, но как проверить исходный код допустим 500 url?
Артем Гвоздев, то что вы знаете хоть один ЯП хорошо, иначе любые наши ответы были бы бестолку.
Касательно php, алгоритм действия следующий. Для загрузки html-кодов страниц используйте функцию file_get_contents() - в сети полно примеров использования, а вот для парсинга загруженных страниц и поиска в них картинок уже нужно применять сторонние библиотеки, лично я бы рекомендовал использовать либо phpQuery либо PHP Simple HTML DOM Parser.
Артем Гвоздев, кстати, есть еще один вариант поиска картинок - вместо использования библиотек для парсинга html, можно просто попробовать составить регулярное выражение. Типа найти все фрагменты начинающиеся с http:// и заканчивающиеся с .jpg - но я регулярках не силен, вам если что придется все самому писать.