@AnKus

Как отфильтровать ссылки?

Как в данном случае отфильтровать нужные ссылки. Те, которые нужны, содержат внутри адреса 'fop'. Возможно, если не строчным методом, то как-то сюда регулярку прикрутить ?

from tqdm import tqdm
from requests_html import HTMLSession

session = HTMLSession()

url = 'https://5140.org/fops?stan%5B0%5D=2'

for i in range(1, 2):
    r = session.get(url, params={'page': i})
    for html in r.html:
        links = r.html.absolute_links

        all_links = []

        for link in tqdm(links):
            if link.ТУТ ДОЛЖЕН БЫТЬ МЕТОД('fop'):
                all_links.append(link)

    with open('all_links.txt', 'a') as f:
        for kvd in all_links:
            f.write(f'{kvd}\n')
  • Вопрос задан
  • 74 просмотра
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
далась вам регулярка, сразу php шников видно

links = [x for x in links iа x.find('ХОП') != -1]
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы