Здравствуйте! Суть беды такая. Есть список сайтов (около 3000). Есть утилита, называется она Top Lead Extractor, и я никак не могу заставить ее нормально работать. Необходимо с каждого сайта взять email и номер телефона. Так вот, либо она находит мне 100500 телефонов и email, никак не относящихся к сути, либо не находит вообще. Хотя на сайтах вполне себе на видном месте (чаще всего в футере или в /contacts) все данные есть. Уже отчаялся, и начал руками собирать данные, но на второй сотне нервы уже начали сдавать. Может кто сталкивался с подобными задачами, расскажите, как поступали? Для примера. беру сайт rbc.ru - номер телефона там
https://www.rbc.ru/contacts/
Вышеуказанная утилита не находит. Если же я указываю ей лазить по всем ссылкам, то начинается полный треш. Соберет все, только не телефон