VEIIINs, на js как-то так:
matchedLinks - адреса, по которым были совпадения.
pagesQuantity = количество страниц.
textToLookup = искомый текст.
websiteLink = тело сайта, на котором ищешь.
Стоит отметить, что из-за кроссайтовой защиты, приходится идти в обход CORS, а это ограничивает количество запросов в единицу времени.
const matchedLinks = [];
const pagesQuantity = 10;
const textToLookup = 'ясос биба';
const websiteLink = 'sait.da/users/';
function parseLink(pageNumber) {
const xhr = new XMLHttpRequest();
xhr.open('GET', `https://cors-anywhere.herokuapp.com/${websiteLink}${pageNumber}`);
xhr.send();
xhr.onload = function () {
if (xhr.status != 200) {
console.log(`Ошибка ${xhr.status}: ${xhr.statusText}`);
} else {
if (xhr.response.indexOf(textToLookup) !== -1) {
matchedLinks.push(`${websiteLink}${pageNumber}`);
}
}
};
}
for (let i = 1; i < pagesQuantity; i++) {
parseLink(i);
}