Задать вопрос
alex-lenk
@alex-lenk
Разработчик сайтов

Есть ли готовый парсер html страниц?

Нужен парсер, которому бы задал папку для сканирования joxi.ru/KAgM5Q3S09BOml и он вывел бы на отдельную html страницу список всех файлов с расширением .html
  • Вопрос задан
  • 889 просмотров
Подписаться 2 Оценить Комментировать
Ответ пользователя Yustas Alexu К ответам на вопрос (5)
Для ноды:

var fs = require('fs');
var path = require('path');
var dir = process.cwd(); // папка та же, откуда запущен скрипт

// все файлы в папке
var files = fs.readdirSync(dir); 

// отфильтровываем html-файлы
var htmlFiles = files.filter(file => path.extname(file) === '.html');

//дальше делайте с ними что хотите, например:
var stream = fs.createWriteStream('my_file.txt');
stream.once('open', fd => {
  stream.write('<ul>\n');
  htmlFiles.forEach(fileName => {
    stream.write(`<li>${fileName}</li>\n`);
  });
  stream.write('</ul>');
  stream.end();
});
Ответ написан
Комментировать