Нахождение новых или измененных записей в большом наборе данных
Есть некоторое кол-во платформ, данные из которых переливаются на конечную платформу.
Большое кол-во платформ представляют собой базы данных, часть платформ предоставляет доступ через API.
Суммарное кол-во записей порядка нескольких миллионов.
Также данные на исходных платформах могут меняться — необходимо отслеживать изменения и обновлять данные на конечной платформе.
Предложите как лучше реализовать механизм заливки новых данных, отслеживания изменений и обновление?