Как и любое другое (в т.ч. десктопное) приложение - реверсить логику работы, декомпилировать код и пытаться повторить запросы либо работать напряму. с изображением, распозновать тексты, симулировать клики.
С точки зрения работы на android - хватит adb, можно параллельно запустить vnc сервер (или любую другую систему удаленного управления) на android, получать скрины по сети (так проще чем через adb). Я только один раз что то автоматизировал и мне хватило teseract для декодирования текста на экране и симуляции кликов средствами adb
Есть чуть более верный подход, написать приложение на основе
accessibility service (как гугловский talkback, это набор инструментов для создания помошников для слабовидящих и любей с ограниченными возможностями) он имеет полный доступ к информации на экране, по элементам а не просто картинка