я думал так сделать: запись перевести в текст, потом текст разбить на слова и поместить в массив. Массив сортируем, например по убыванию и таким образом сравниваем оригинальный текст и преобразованный из голоса
плохая идея и корявое звучание будет незамечено, ИМХО. Нужно работать на низком уровне, то есть голоса, а не текста. Speech frame.
То есть нужен оригинал профессионального произношения и сравнивать со звуком с микрофона.
MrRitm, если только изнутри, то пункт 2 моего ответа. И только если не поможет, тогда 3.
Суть состоит в том, чтобы найти какой процесс создает соединение. По номеру процесса уже можно получить всю необходимую информацию.