Василий Банников, Я посмотрел (azure), что-то похожее есть что я искал, буду потихоньку с этим разбираться. Еще раз спасибо за ответ. К сожалению, здесь в этой ветке комментариев я не могу ваш комментарий выбрать ответом на вопрос, если вы напишите его и где "ОТВЕТЫ НА ВОПРОС" то я отмечу его решением.
Я уже понял что неправильно выразился, записывают в смысле транскрибируют, записывают из аудио в текст. Мне нужны нейросети\программы\сервисы, которые транскрибируют(speech recognition) все до буквы, все что сказано, без исправлений и "додумываний", просто транскрибировал все до буквы, со всеми запинками, со всеми словами без исправлений.
Василий Банников, Хорошо, спасибо, но я поискал по этому запросу и там есть для транскрипции, транскрибации и т.д., а чтобы была функция сравнения одного голоса с другим такого не нашел. Программ/нейросетей/сервисов с такой функцией нет?
Sand, Вроде похоже на то что хотел. Пойду пока пробовать. И проверять будет ли он следовать за движущимся объектом, на который сфокусировался и увеличил