У тебя же есть атрибут Photo, а он в свою очеред является экземпляром класса UserProfilePhoto. Можешь посмотреть его методы, скорее всего там есть метод для скачивания.
А еще есть там же
photo_small=FileLocationToBeDeprecated
и
photo_big=FileLocationToBeDeprecated
Ну смотри, большинство уроков по написанию телеграм ботов делаются на основе pyTelegramBotApi, но эта библиотека является синхронной, хотя у нее походу есть зачатки асинхронности, так как видел классы, в названии которых фигурирует Async, aiogram является асинхронным, что в перспектиае для высоконагруженных систем является более приоритетной, но для этого надо вообще хотя бы знать, что из себя представляет асинхронность.
Насколько я помню, когда ты оправляшь боту голосовую, то в объекте, который приходит в обработчик, есть у голосового file id, который ты можешь сохранить и потом обратно его отправить
Можно например Inline клавиатуру ввести с текстом Я согласен с правилами и какой нибудь callback data, потом если он нажимает на эту кнопку, то запоминать, что он уже нажимал на это кнопку. То есть смотреть id пользователя и сохранять то, что он ранее нажимал на это, например в словаре, или в бд, если уже знаешь, как ей пользоваться
Потому что send_message не аналогичен print, где ты можешь перечислить переменные через запятую, и они выведутся, правильнее f"Всего побед : {x2}", то есть сразу готовую строку надо передаватб