У меня есть telegram бот который парсит новости с нескольких сайтов . Но проблема в том, что все парсеры работают не на постоянной основе. Мне нужно, чтобы они работали через определённое время. Например раз в 5 минут ещё раз парсили инфу с сайта и так на постоянной основе.
Вот сами парсеры:
Этот на RSS основе
import requests
from bs4 import BeautifulSoup
url = 'https://kod.ru/tag/news/rss/'
r = requests.get(url=url)
print(r.status_code)
xml = BeautifulSoup(r.text, 'xml')
items = xml.findAll('item')
print(len(items))
def dur():
for item in items:
print('------------------------------')
print('Заголовок: ', item.find('title').text)
print('URL: ', item.find('link').text)
print('data: ', item.find('pubDate').text)
return item.find('link').text
Этот на HTML основе
import requests
from bs4 import BeautifulSoup
url = 'https://ria.ru'
r = requests.get(url=url)
print(r.status_code)
html = BeautifulSoup(r.text, 'html.parser')
def hello ():
for item in html.findAll('div', class_='cell-list__item m-no-image'):
print('------------------------------')
print('Заголовок: ', item.find('span', class_='cell-list__item-title').text)
print('URL: ', item.find('a', class_='cell-list__item-link')['href'])
return item.find('a', class_='cell-list__item-link')['href']