proxy , много-много, если вы о Гугле, это основное препятствие
базы обычно две - NoSQL для неструкрутированных данных (из печки которые), и MySQL / Postgre уже для исорического хранения
сейчас кое под что можно и Clickhouse
1) готовое решение - вы ж сами перечислили, найдите кто подгонит, да и все
2) по стоимости смотрите на fl.ru сколько предлагают за парсеры - и как быстро соглашаются
3) WP проще всего, и дешевле всего поддерживать