Здравствуйте.
Есть небольшой парсер сайтов, необходимо заставить его работать быстрее.
Структура:
# блок с импортами
import ....
# блок с подключением к БД (оттуда нужно забрать урлы по которым пройтись)
conn = sqlite3.connect('db.sqlite3')
curs = conn.cursor()
select = curs.execute("SELECT url from test;")
# блок с основной функцией, которая забирает данные с сайта
def scrape(link):
....
# блок записи в БД, используя подключение выше
return "Success"
# блок, который вызывает функцию scrape для каждого элемента, что был взят из БД
for link in select.fetchall():
scrape(link)
Пытался добавить мультипоточность(к сожалению безуспешно), используя модуль - threading
И данный код:
thread_list = []
t = threading.Thread(target=scrape, args=(link,))
thread_list.append(t)
for thread in thread_list:
thread.start()
for thread in thread_list:
thread.join()