Ответы пользователя по тегу Обработка звука
  • С помощью какой AI модели можно локально обработать аудио-файлы (русский голос)?

    @rPman
    whisper от openai (apache2.0 лицензия) и его производные, на текущий момент лучшая модель общего назначения. Лицензия позволяет пользоваться этим но при включении его в тиражируемые продукты, лицензия на исходный код этих производных продуктов так же должен быть открыт.

    Так же модели по работе со звуком есть у всех топовых компаний, например у мозиллы deepspeech и у фейсбука, и у гугла, и у китайского qwen и т.п. но под вопросом качество русского языка, полистай, осторожно тут все в кучу свалено, не только прямая трансляция но и к примеру токенизаторы, векторизаторы и т.п.
    Ответ написан
    Комментировать
  • Сравнение голосов - программы и нейросети - есть ли такие?

    @rPman
    https://huggingface.co/models?other=speaker-recognition как отправная точка для поиска готовых моделей (можно поиграть с поисковым запросом)
    Ответ написан
    1 комментарий
  • Какой сервис озвучки самый естественный по вашему мнению?

    @rPman
    <на правах шутки>
    openai gpt4o
    Мне кажется на текущий момент это лучшая технология, которую можно приспособить для озвучки, иначе вложиться в обучение своих голосовых моделей (много текстов профессиональный диктор должен наговаривать). На грани зловещей долины, или уже вышла за нее, голос живой, да русский не идеален.

    api пока нет, доступа у всех пока нет, только 6 голосов но в некоторых пределах можно 'настраивать' их стиль, стоит 20$ в месяц, лимиты на объемы текстов в минуту, управление на естественном языке.

    p.s. у openai есть api и сервисы по распознованию и синтезу речи, потестируй их, возможно они окажутся достаточно качественными
    Ответ написан
    Комментировать
  • Как сделать так, чтобы микрофон не слышал других людей в комнате?

    @rPman
    Это узкополосный усилитель (звуковая карта/материнка или сам микрофон), настроенный на речь.

    Попробуй подключить микрофон на line in, там усилителей нет.

    С некоторыми шансами можно отключить усиления програмно, ищи в настройках звука, для win7 помню с драйверами материнских плат шли обвешанные рюшечками gui для настроек, держал помню ради одной похожей настройки, но теперь в win10 это кажется стандартизировали и опций стало сильно меньше.
    Ответ написан
  • Где найти место для записи аудио для уроков?

    @rPman
    Буквально, помню в шкафу с тряпками сидел записывал (не ютуб, еще до него)

    шутка, а может и нет
    На один раз прокатит
    Ответ написан
    2 комментария
  • Как записать 4-канальный звук?

    @rPman
    крутейшая консольная утилита (там и библиотека есть) опенсорс, поддерживает наверное максимум оборудования, кроссплатформенная - это ffmpeg

    странно что не попытались сами сделать, во первых параметры звука будут взяты изх системных настроек (если там выбрать четыре канала то ffmpeg по уму должен автоматом подхватить), если что можно указать принудительно какой профиль: -channel_layout quad -channels 4
    если у тебя винда, смотри пример как записывать с микрофона тут
    Ответ написан
    Комментировать
  • OBS - помехи при записи с USB микрофона?

    @rPman
    попробуй покрутить параметры дескритизации, у obs по умолчанию может стоять что то типа 96kHz когда как у остальных данные берутся из системных настроек а там стоит скорее всего 'стандартные' 44k
    Ответ написан
    4 комментария
  • Как создать два независимых вывода аудио из-под разных источников в Windows 10?

    @rPman
    В вашем случае можно воспользоваться настройками Media Player Classic, который позволяет определить через какие колонки какой канал выводить, понижая количество колонок, например стерео выводить на пару колонок квадро.

    Настройки - встроенные фильтры - Аудио переключатели, добавить каналов и отметить два нужных.

    В настройках windows нужно включить квадрофонический вывод, подключив к передним наушники а к задним колонкам - динамики.

    Панель управления - звук - Настроить (как я понял потом вы можете это переключить обратно на стерео либо ).

    Дело в том что когда я это настраивал, то все делал с помощью штатной утилиты realtek, но последние годы ее исключили из поставки, поэтому дальше уже ваши эксперименты.
    Ответ написан
    Комментировать
  • Как быстро убрать звуковую рекламу из видео, не пережимая весь видео файл?

    @rPman
    ffmpeg позволяет работать с audio и video независимо, не пережимая video, т.е. достаточно будет перепаковать только звук, это минуты.

    Общая идея - выявляешь временные метки, где нужно заменить кусок звуковой дорожки, затем вырезаешь соответствующие части дорожки в отдельные файлы, и собираешь обратно, подменив вырезанные куски на свой пустой.

    Лучше читать документацию и гуглить примеры, с фильтром или без
    Ответ написан
    2 комментария
  • Запись звука на компьютере?

    @rPman
    Работа со звуком требует в первую очередь - тихое помещение. Обычный компьютер, с воздушным охлаждением, очень шумный, вы могли к этому привыкнуть а бездушная машина все эти звуки услышит и запишет все равно.

    Помню были примеры, когда народ записывал свои речи, сидя в шкафу, буквально. А так, если вам так надо либо звукоизолируйте помещение сами либо арендуйте готовое, так как свое обойдется в хорошую копеечку.

    Второе - нормальное оборудование, хороший микрофон, экранированные провода (или вообще беспроводные, только не bluetooth, если вам нужно качество звука) и повторюсь, можно арендовать помещение для звукозаписи.

    Если вам надо здесь и сейчас и побюджетнее, покупайте длинный hdmi провод, радиоклавиатуру с мышкой, берите смартфон с приложением-диктофон, и выносите все это с монитором в соседнюю комнату (хоть в туалет, я не шучу), закрывайте двери, вешайте на стены ковры, тряпки и прочее (они глушат эхо). Смартфон вообще отличное устройство для записи речи, не добавляет шумов (пассивное охлаждение), правда штатный микрофон обычно слабый, но никто не мешает купить гарнитуру (озаботьтесь переходниками, так как большинство гарнитур хотят 2 миниджека 3.5 вместо одного как в смартфоне, если он у вас вообще есть, но если нет то сами себе буратины).
    Ответ написан
    Комментировать