Всем привет!
Пишу парсер на node.js. Столкнулся с проблемой. Не могу найти способ вытащить все urlы сайта.
Например есть сайт :
example.com а у него внутри различные url'ы, например
example.com/article1-100
Хочется вытащить все такие адреса в массив а потом уже через request и cheerio парсить содержимое.
Придумал вариант когда отдельные части адреса (article, 1, 2, 100) могут лежать в массиве и подставляться к основному url в процессе поиска, но это нужно под каждый сайт такое делать.
Можно ли как-то более универсально искать url'ы сайта введя только основной
example.com . Смотрел в сторону регулярных выражений, но не совсем понятно как их тут можно использовать. Подскажите плиз.
Спасибо