toster_root
@toster_root

Как написать скрипт для парсинга изображений с html страниц локально?

Подскажите пожалуйста, как реализовать следующее:
Есть очень много html страниц (скаченные на ПК). На данных страницах расположены каталоги фото. Вручную собственно качать отдельно каждую картинку не лучший вариант. Хотелось бы выгрузить все фото со страниц html в отдельную папку. Как это можно сделать? Думаю попробовать самому разобраться и написать подобный скрипт если это реально конечно выполнить (выгрузить фото с html файла).

PS. Язык по сути не важен, но желательно пхп, js/нода.
  • Вопрос задан
  • 224 просмотра
Решения вопроса 1
hzzzzl
@hzzzzl
выгрузить все фото со страниц html -- они там просто как img src="" ?

cheerio.js для ноды,
в него загружаешь html, и из него через обычные css-селекторы получаешь массивы
https://hackernoon.com/cheerio-node-nodejs-tutoria...
https://github.com/cheeriojs/cheerio

то есть псевдокодом
fs.readFile('myHtml.html') -> cheerio.load(file) -> imageArray = $(' .klassFotok img ') -> imageArray.forEach принести img src и сохранить
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы