@historydev
Редактирую файлы с непонятными расширениями

Как из html (в поле объекта или переменной) вырезать блок по классу?

Доброе утро. скажите пожалуйста как мне вытащить блок из целой html страницы, у меня есть вот такой код:

async function Scrap(query, type) {

    return new Promise((resolve, reject) => {

        torridest.request(`https://www.rusprofile.ru/search?query=${encodeURI(query)}&type=${type || 'ul'}`, async (err, res, body) => {

            if(!err && res.statusCode === 200 && body !== null) {

                resolve(body);


            } else {

                await torridest.renewTorSession(async (err, msg) => {
                    if (msg) {
                        await Scrap(query, type);
                    }
                });

            }

        });

    });

}


Он возвращает страницу через body в колбэке, я не нашёл решения с document.querySelector как допустим в папитере, поэтому приходится работать с тем что есть, немного отойдём от вопроса, здесь вот этот участок обновляет ip в торе, может есть подобное в папитере?

await torridest.renewTorSession(async (err, msg) => {
                    if (msg) {
                        await Scrap(query, type);
                    }
                });


Так вот, на выходе я получаю страницу от html до html и мне хотелось бы убрать всё кроме блока по классу допустим. Это звучит как бред, но я вижу только этот выход, возможно есть другие? Спасибо
  • Вопрос задан
  • 43 просмотра
Пригласить эксперта
Ответы на вопрос 1
@Che603000
c 2011 javascript
два варианта
1) работать как со строкой - использовать регулярные выражения.
2) преобразовать текст с xml, а затем в json и работать как с обьектом js.
https://www.npmjs.com/package/xml-parse
https://www.npmjs.com/package/xml2json
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы