Здравствуйте!
Обычно для таких задач либо разрабатывают кастомные парсеры под конкретный проект, либо используют уже готовые решения. Я, как SEO-специалист, регулярно использую Screaming Frog SEO Spider — в принципе, этот инструмент полностью закрывает подобные потребности. С его помощью можно спарсить практически любой контент с любого сайта (ну почти) и использовать его для своих нужд.
Кроме того, есть удобный способ через обычные Google Таблицы. Существуют специальные формулы, которые позволяют вытягивать элементы страницы (например, цены или заголовки) прямо в таблицу через копирование XPath нужного элемента и прописывания в формуле. Если вам интересно, я могу поделиться деталями в лс или в ответ — пишите, расскажу подробнее.
Также, поскольку из вашего вопроса не до конца понятно конечное решение, упомяну, что есть софт, позволяющий скачать весь сайт целиком в его исходном виде. Для Mac, например, отлично подходит SiteSucker Pro. Выбор инструмента в итоге зависит от того, что именно и в каком объеме вам нужно выгрузить.