Приветствую, пытаюсь спарсить сайт: [
foxtools.ru/Proxy ]
Выдает ошибку выхода за пределы массива, что странно учитывая что строка в приложенном фото должна соответствовать выборке. Ошибка снизу.. что с этим делать?
import requests
from bs4 import BeautifulSoup
def get_html(site):
r = requests.get(site)
return r.text
def get_page_data(html): #sources
soup = BeautifulSoup(html, 'lxml') #(format_in, parser)
line = soup.find('table', id='theProxyList').find_all('tr') #resolve table
for tr in line:
td = tr.find_all('td')
ip = td[1].text
port = td[2].text
country = td[3].text
anonym = td[4].text
types = td[5].text
time = td[6].text
data = {'ip': ip,
'Port': port,
'Country': country,
'Anonymize': anonym,
'Type': types,
'Time': time}
def main():
url = 'http://foxtools.ru/Proxy'
get_page_data(get_html(url))
if __name__ == '__main__':
main()
Код ошибки:
Traceback (most recent call last):
File "D:/home/projects/Python/Parser_proxy.py", line 34, in <module>
main()
File "D:/home/projects/Python/Parser_proxy.py", line 31, in main
get_page_data(get_html(url))
File "D:/home/projects/Python/Parser_proxy.py", line 15, in get_page_data
ip = td[1].text
IndexError: list index out of range