Делал подобную задачу для нескольких магазинов потерявших все данные.
1) Сгружаем данные в виде HTML страниц из разных источников. WebArchive я покупал тут
www.webarchivedownloader.com . Есть альтернативы на торентах, есть онлайн решения.
2) Сгружаем Google И Yandex Cache. (Если сайт недавно пропал и поисковики еще не успели выкинуть сайт из индекса)
3) Локально разворачиваем сайт на базе полученных HTML страниц (XAMP, Denver etc)
4) Парсим локальные сайты с теми настройками и параметрами, которые вам необходимы. Я пользовал Screaming Frog.
Парсил все Title, Meta Description, Breadcrumbs, H1, URL, Images, Description, Content, Price и тд
5) Данные после парсинга можно сохранить как CSV и обработать вручную в Excel (почистить ненужные теги, убрать переспамы от предыдущих сеошников в татйлах и тд)
6) Импортировать CSV в WP WooCommerce.
Как то так.