В принципе не сильно важно python или nodeJS. Выберите то что больше нравится.
Я так понимаю что должен быть сайт + скрипт который постоянно запущен и мониторит. Работает с БД и соответственно управление им будет происходить через БД.
Также нужно определиться насколько "реалистично" он парсит страницы. Выполняет ли на них JS (а щас бывает данные подгружаются через JS).