я так полагаю, что под автоматическими тестами тут подразумевается скрипт на перле, который будет говорить что что-то после пересборки проекта сломалось. Зачем писать это именно на перле не понятно, но алгоритм все рано один и тот же для всех
для каждого набора параметров запоминаешь вывод программы (это канонизация)
потом в скрипте запускаешь свою тулзу с параметрами и сравниваешь вывод с тем что запомнил. Если не совпало - громко ругаешься.