Cron — для выполнения по расписанию.
VK API (оно должно быть удобнее для этих целей) / CURL (изображаем браузер) — для получения данных
HTML parser (специфично для каждого языка. Лучший вариант если соберётесь косить под браузер)
SQL запрос / ORM / AR для общения с БД.
В общих чертах как-то так.