Требования указанные в вопросе - это не требования, а само-собой разумеющиеся, очевидные вещи.
Вот Вы каким способом собираетесь голос распознавать? Допустим, это будет какой-нибудь VOSK. Значит и смотрите системные требования к этой библиотеке, гуглите статьи про её практическое применение. Понимаете, на каком железе её реально запустить. Вот это уже будут требования.
А может Вы под "голосовым ассистентом" имеете ввиду всего лишь вот такую железку:
https://aliexpress.ru/item/1005006984724984.html ? Это совсем другие требования будут.