Миф или реальность? Начало записи разговора по ключевому слову?
Все чаще слышу что ОПСОСы или ОВД или какие другие структуры, обладают возможность записи разговоров, услышав ключевое слово в разговоре. Сам я слабо представляю какие должны быть мощности что бы отфильтровывать все разговоры, записывать нужные да и ещё распознавать речь людей. Поэтому мне это кажется совершенно нереальным, и считаю что миф. А как думаете вы?
Как человек, имевший отношение к разработке СОРМ (2006-2007) заявляю, что подобные разработки велись и результаты были весьма впечатляющие. Честно признаюсь, что не знаю, дошла ли разработка до внедрения, так как порог «слышимости» был низок на потоке — что-то около 50% (на одном потоке, те один разговор, слышимость была на уровне 99%). Поэтому не исключаю, что при «прослушке» отдельного номера (те фактически ситуация одного потока) — вполне подобное может работать и начинать фиксацию аудиопотока на стоп-словах.
ixSci, а о каких мощностях вы говорите? У нас было несколько «путей»: ПЛИСы, простые сигнальные процессоры с обвязкой, ну и «десктопное» решение. DSP выиграли с малым перевесом у десктопов. Ребята из команды плисовцев ходили со слезами на глазах, ибо мало что получалось
Разработки велись в лаборатории с одним потоком?
Я просто видел, что творилось с СОРМом при постановке только одного московского префикса, и только на статистику, сиречь сигналинг. Ему было плохо. А если добавить сюда еще тот факт, что нужно, чтобы все голосовые потоки сливались(без анализа) это уже очень сильно увеличит нагрузку. А теперь добавим, что каждым поток надо анализировать. Будем датацентры под СОРМ строить? :)
СОРМ2, он же интернетный, умеет трафик анализировать по ключевым словам. И это является(являлось?) одной из самых ресурсо-пожирающих операций, которая заставляла представлять кластерные решения. Так им не надо голос декодировать и анализировать…
Я, правда, не знаю, что за контора в которой Вы работали. Но там где я работал(2009-2011), о таком никто даже не говорил. А мы(они) поставляли(поставляют?) большую часть СОРМ решений в России и СНГ, насколько я знаю.
Да, разработки велись только в лаборатории, но не только с одним потоком. При многопоточности та разработка попросту захлёбывалась — было чудовищно много ошибок первого рода. А вот при одном потоке всё работало на ура :). Когда я уходил, компания вела переговоры с МВД (могу быть неточен в названии ведомства, переговоров было много) о получении денег на дальнейшие исследования. К сожалению, все ребята с которыми я там работал (моя тёплая компания) тоже разошлись — так что сейчас не могу выяснить чем дело кончилось.
Я предполагаю, основываясь на том, что вы говорите (у вас инфа как минимум свежее, не считая статуса конторы), что всё так и осталось лабораторными образцами :(
Но как ведь было круто! Говоришь всякую ахинею, а на нужных словах диодик зажигался, в лог вероятность писалась…
А вот у меня другой вопрос созрел на основе вашего «Будем датацентры под СОРМ строить?», а могут ли наши органы арендовать мощности у того же Яндекса — в рамках поддержки нацобороны?
Я думаю, что наши ведомства могут всё, что угодно в нашей стране если сильно захотят. Но, чтобы «отжать» датацентр у Яндекса, причина должна быть весьма существенная.
Я думаю, что записываются все разговоры людей, которые по каким-то причинам интересны службам.
Впоследствии (например, началось уголовное дело или нужен компромат) записи могут поднять, прослушать и сделать расшифровку одушевлённые сотрудники.
Наибольшего прогресса в области «промышленного» распознавания голоса удалось достичь Гуглу — у них есть стандартная фишка в Google Voice — расшифровка автоответчика. Я практически не пользуюсь Google Voice, переадресация не настроена, и все входящие идут на автоответчик, а звонят в основном рекламные роботы с предложением рефинансировать ипотеку :) Так вот за те несколько лет, что у меня есть Google Voice он НИ РАЗУ не смог 100% правильно расшифровать сообщения на автоответчике. Делайте выводы.
У меня наоборот, Google Voice почти всегда правильно расшифровывает. Не понимает только если уж совсем местная калифорнийка говорит, там и я испытываю сложности.