@kvellou

Как решить проблему с Silero?

import torch
import sounddevice as sd
import time
import datetime
import num2word

lang = "cyrillic"      #определение языка и модели
model_id = 'v4_cyrillic'

device = torch.device('cpu')  #использование ram памяти 


model , _ = torch.hub.load(repo_or_dir='snakers4/silero-models',   #получение модели с помощью библиотеки torch
                           model = 'silero_tts',
                           language=lang,
                           speaker=model_id)
model.to(device)

def speaker(text):  
    sample_rate = 48000   #определение дискретизации 
    speaker = "kz_M2"  #Выбор спикера
    put_accent = True  #Настройка речи
    put_yo = True
    audio = model.apply_tts(text=text,         #Создание аудио
                            speaker=speaker,
                            sample_rate=sample_rate,
                            put_accent=put_accent,
                            put_yo=put_yo)
    print(text)

    sd.play(audio , sample_rate)  #проигрыватель аудио
    time.sleep(len(audio) / sample_rate)
    sd.stop()

Работаю с silero казахского языка. Но есть проблема с озвучки чисел, символов и мультиязычности. Как можно решить эту проблему.
  • Вопрос задан
  • 55 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы