Парсите через API VK, все очень удобно, сразу получаете массив данных.
По новым постам, два варианта:
1) Писать в БД/тхт id спаршеных постов
2) Сдвиг по времени.
По опыту, лучше и удобней писать результат сразу в БД, и удобней потом эти данные применять, и удобней отслеживать дубли.