Как реализовать сопоставление текста и речи?

Question

Никита Колосов @nik184

PHP-Symfony, Android developer

Как реализовать сопоставление текста и речи?

Задача в том, чтобы определить в мобильном приложении, правильно ли человек прочитал текст с экрана устройства.

Сейчас я реализовал это так: дефолтный гугловый спич рекогнайзер, встроенный в мой смартфон, распознает речь, и уже полученный результат я сопоставляю с текстом. В долгосрочной перспективе это плохой вариант, т.к. иногда этот спич рекогнайзер бессовестно врёт.

Есть ещё google speech api и аналогичное у amazon. Они поумнее, могут присылать вам разные варианты распознанного текста, если сомневаются, но они дорогие, если распознавать много.

Какие ещё есть технологии, которые можно было бы использовать для решения подобной задачи? Возможно, другие сторонние api или открытые библиотеки? Или, быть может, проще написать свою нейросеть, ведь задача сопоставления с текстом в теории должна быть сильно легче, чем просто распознавание голоса?

Вопрос задан более трёх лет назад
155 просмотров

Комментировать

Подписаться 5 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- вчера
- 73 просмотра
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 303 просмотра
0

ответов
Нейронные сети

Простой
Как решить проблему с генерацией видео в Kling AI?
- 1 подписчик
- 09 июл.
- 79 просмотров
1

ответ
Хранение данных

+3 ещё

Средний
Как организовать обучение нейронной сети?
- 1 подписчик
- 07 июл.
- 152 просмотра
2

ответа
API

+1 ещё

Сложный
Не работает ключ доступа для работы с botAPI, как до разработчиков достучаться?
- 1 подписчик
- 26 июн.
- 156 просмотров
0

ответов
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Нейронные сети

Средний
Как в AI ToolKit для тренировки LorA указать свои модели?
- 1 подписчик
- 09 июн.
- 74 просмотра
1

ответ
Telegram

+1 ещё

Простой
Не подключается тг апи к яндекс клауд, что делать?
- 1 подписчик
- 04 июн.
- 413 просмотров
3

ответа
Нейронные сети

Простой
Есть ли нейросети для интерактивной работы с изображениями?
- 2 подписчика
- 13 мая
- 290 просмотров
2

ответа
Боты

+1 ещё

Простой
Какие посоветуете лучшие доступные LLM, для организации на её базе офисного бота?
- 2 подписчика
- 06 мая
- 407 просмотров
5

ответов
Показать ещё Загружается…

Answer 1 · 2021-06-08 10:04:25

Сопоставление прочитанного с написанным?
Пускай кто-то из них вернет вам текст речи с указанием основных моментов расстановки речи, его и сравнивайте хотя бы по словам. идеально если сами распознавать будете.

Как реализовать сопоставление текста и речи?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт