ffmpeg
гугли использования overlay, maskmerge или alphamerge [mask]
общая идея, ты указываешь исходное видео и изображение с маской, и указываешь как именно одно должно вычитать другое
пример с
overlay мне кажется тебе подходит лучше всего (тут цвет заменяется на изображение)
гугл находит более сложные примеры, типа
таких или
таких