У аудиофайла и голосового сообщения есть ключ "duration". При приходе такого файла, можете поставить таймер на "duration" секунд и выполнить действие.
А события нет.
Vindicar, это единственное, что я могу предложить.
Максимум - отслеживать когда сообщение с аудио считается прочитанным и после этого запускать таймер. Но снова же - это не гарантии, а просто попытка реализовать хоть что-то приближенное к тому что нужно с инструментами, которыми мы можем пользоваться.
Или же просить пользователя поставить эмоцию, когда он прослушал запись, собственно, отслеживать эмоции на аудио и совершать какое-то событие, когда эмоция поставлена. Но по-моему события отслеживающего эмоции нет, но могу ошибаться. Если события все же действительно нет, то снова городить костыли