Программа реализует следующий алгоритм:
- прохожу по урл (
http://сайт/id=значение)
- получаю данные, среди которых есть ссылка "подробнее"
- прохожу по ссылке "подробнее"
- получаю данные
- заношу данные в бд
Сейчас программа работает в 3 потока и скорость составляет 3-4 записи в базу за 2 секунды.
Страниц, которых необходимо спарсить больше 2 млн и чтобы пройтись по всем при текущей скорости работы понадобится очень много времени.
Получение страницы и парсинг происходит с помощью библиотеки HtmlAgilityPack
Как можно ускорить работу?