project1=soup.find('table', summary='Краткое описание других проектов Фонда Викимедиа и ссылки на них')
project1
Out[14]:
<table align="center" cellspacing="2" class="plainlinks" style="text-align:left; width:90%; background:transparent; line-height:1.25em" summary="Краткое описание других проектов Фонда Викимедиа и ссылки на них">
<tbody><tr>
<td style="text-align:center; width:50px"><a href="//wikipedia.org"><img alt="Wikipedia-logo.png" data-file-height="200" data-file-width="200" decoding="async" height="20" src="//upload.wikimedia.org/wikipedia/commons/thumb/6/63/Wikipedia-logo.png/20px-Wikipedia-logo.png" srcset="//upload.wikimedia.org/wikipedia/commons/thumb/6/63/Wikipedia-logo.png/30px-Wikipedia-logo.png 1.5x, //upload.wikimedia.org/wikipedia/commons/thumb/6/63/Wikipedia-logo.png/40px-Wikipedia-logo.png 2x" width="20"/></a>
....
p2=project1.find_all(href=re.compile('https:\/\/'))
for i in p2: print (i.get('href'))
https://wikipedia.org
https://commons.wikimedia.org/wiki/%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0?uselang=ru
https://www.wikidata.org/wiki/Wikidata:%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0
https://meta.wikimedia.org/wiki/%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0?uselang=ru
https://wikisource.org
https://wikibooks.org
https://wikiquote.org
https://incubator.wikimedia.org/wiki/Incubator:Main_Page/ru?uselang=ru
https://wikinews.org
https://wikivoyage.org
https://species.wikimedia.org/wiki/%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0?uselang=ru
https://mediawiki.org/wiki/MediaWiki/ru?uselang=ru
https://wiktionary.org
https://wikiversity.org
In[2]: from bs4 import BeautifulSoup
In[3]: e='''<div class="col-md-9">
...: <span id="clock"></span>
...: <i class="far fa-clock small mr-1"></i>
...: " 2 days 16 hrs ago (Aug-24-2022 07:35:26 PM +UTC) "
...: </div>'''
In[4]: e
Out[4]: '<div class="col-md-9"> \n<span id="clock"></span> \n<i class="far fa-clock small mr-1"></i>\n" 2 days 16 hrs ago (Aug-24-2022 07:35:26 PM +UTC) "\n</div>'
In[7]: BeautifulSoup(e)
Out[7]:
<html><body><div class="col-md-9">
<span id="clock"></span>
<i class="far fa-clock small mr-1"></i>
" 2 days 16 hrs ago (Aug-24-2022 07:35:26 PM +UTC) "
</div></body></html>
In[8]: BeautifulSoup(e).text
Out[8]: '\n\n\n" 2 days 16 hrs ago (Aug-24-2022 07:35:26 PM +UTC) "\n'
with open (fname, 'r', encoding='utf') as f:
res=[]
c=0
for i in range (0,7) : #до правой границы, не включая 7
r=f.readline()
if c in range (3,7): # от левой границы, включая 3, до правой, не включая 7
res+=[r]
c+=1
x = [2**0, 2**1, 2**2, 2**3, 2**4, 2**5, 2**6, 2**7, 2**8, 2**9, 2**10]
for i in range (0,len(x)):
if x[i]>y:
print (x[i-1],y)
break
\папка\user_file
это относительный путь, и он подойдет только для случая, если скрипт запускается из той же директории, где находится директория папка. Если нет, пусть надо изменить.d={'ru':{"yes":"да","no":"нет"....,
'ua':{....
'en':{...
}
rows = soup.find('table',class_ ='betinfo2').find('tbody').find_all('tr')
from selenium import webdriver
import selenium
import time
driver=webdriver.Chrome('C:\\inst\\chromedriver_win32\\chromedriver.exe')
page2='https://____.ru/gde_kupit_kvartiru/agentstva_nedvizhimosti?page=1'
driver.get(page2)
time.sleep(3)
driver.find_element(selenium.webdriver.common.by.By.XPATH,
f'//*[@class="show-"]').click()
time.sleep(4) #я задержку ставил на всякий случай, возможно, сработает и без неё, если там совсем никто с парсерами не борется
try:
a=driver.find_element(selenium.webdriver.common.by.By.XPATH,
f'//li[contains(@class, "phone-")]').text
print ('a=', a)
except Exception:
print (Exception)
try:
b=driver.find_element(selenium.webdriver.common.by.By.XPATH,
f'//a[contains(@href, "tel:+")]').text
print ('b=', b)
except Exception:
print (Exception)
import schedule
schedule.every
Out[6]: <function schedule.every(interval:int=1) -> schedule.Job>
for vm in asl_vms:
if service not in vms:
vms[service] = {'language': language, 'memory': vm['memory'], 'disk': vm['disk'], 'cpu': vm['cpu'], 'cpuNumber': vm['cpuNumber'], 'vms_exist_updated': 0, 'vms_required': 0, 'max_index': number, 'nodes_used': {} }
vms[service][increment] += 1