Как сделать голосовой поиск в ютубе для ассистенте?

Question

maksim4ik69 @maksim4ik69

Как сделать голосовой поиск в ютубе для ассистенте?

Не знаю какую переменую постасить в search_term
в програмированию мало понимаю, но тут нужно срочно

search_term = переменная поиска в ютубе, точнее запроса, я говорю ассистенту Кеша видео: после чего он доложен запустить ютуб и ввести слова после " Кеша видео" в строчку поиска

1. что пробовал это Пробовал туда писать recognition_cmd, после чего хотел подставить в переменную rec.PartialResult(), перед этим импортируя rec
from stt import rec, в итоге вышло в поиске просто [Text], а не слова которые шли после "Кеша видео" выхлоп речи просто не записывается в [Text}

Подскажите что я делаю не так

Вот моя заготовка( дальше не разобрался )
распознавания речи на silero

Заготовка которую нашел в гугле

elif cmd == "sreachyoutube":
        search_term = (Тут незнаю что поставить).replace("Кеша видео", " ")
        url = "https://www.youtube.com/results?search_query=" + search_term
        webbrowser.get().open(url)
        text = "Готово"
        tts.va_speak(text)

а вот уже почти фулл код, мб кто-то знает, буду очеень благодарен за помощь

main

spoiler

# КЕША 2.0

import config
import stt
import tts
from fuzzywuzzy import fuzz
import datetime
from num2t4ru import num2text
import webbrowser
import random


print(f"{config.VA_NAME} (v{config.VA_VER}) начал свою работу ...")


def va_respond(voice: str):
    print(voice)
    if voice.startswith(config.VA_ALIAS):
        # обращаются к ассистенту
        cmd = recognize_cmd(filter_cmd(voice))

        if cmd['cmd'] not in config.VA_CMD_LIST.keys():
            tts.va_speak("Что?")
        else:
            execute_cmd(cmd['cmd'])


def filter_cmd(raw_voice: str):
    cmd = raw_voice

    for x in config.VA_ALIAS:
        cmd = cmd.replace(x, "").strip()

    for x in config.VA_TBR:
        cmd = cmd.replace(x, "").strip()

    return cmd


def recognize_cmd(cmd: str):
    rc = {'cmd': '', 'percent': 0}
    for c, v in config.VA_CMD_LIST.items():

        for x in v:
            vrt = fuzz.ratio(cmd, x)
            if vrt > rc['percent']:
                rc['cmd'] = c
                rc['percent'] = vrt

    return rc


def execute_cmd(cmd: str):
    if cmd == 'help':
        # help
        text = "Я умею: ..."
        text += "произносить время ..."
        text += "рассказывать анекдоты ..."
        text += "и открывать браузер"
        tts.va_speak(text)
        pass
    elif cmd == 'ctime':
        # current time
        now = datetime.datetime.now()
        text = "Сейч+ас " + num2text(now.hour) + " " + num2text(now.minute)
        tts.va_speak(text)

    elif cmd == 'joke':
        jokes = ['Как смеются программисты? ... ехе ехе ехе',
                 'ЭсКьюЭль запрос заходит в бар, подходит к двум столам и спрашивает .. «м+ожно присоединиться?»',
                 'Программист это машина для преобразования кофе в код']

        tts.va_speak(random.choice(jokes))

    elif cmd == 'open_browser':
        chrome_path = 'C:/Program Files (x86)/Google/Chrome/Application/chrome.exe %s'
        webbrowser.get(chrome_path).open("http://python.org")

    elif cmd == "sreachyoutube":
        search_term = (Тут незнаю что поставить).replace("Кеша видео", " ")
        url = "https://www.youtube.com/results?search_query=" + search_term
        webbrowser.get().open(url)
        text = "Готово"
        tts.va_speak(text)

# начать прослушивание команд
stt.va_listen(va_respond)

tts

spoiler

import torch
import sounddevice as sd
import time

language = 'ru'
model_id = 'ru_v3'
sample_rate = 48000 # 48000
speaker = 'aidar' # aidar, baya, kseniya, xenia, random
put_accent = True
put_yo = True
device = torch.device('cpu') # cpu или gpu
text = "Хауди Хо, друзья!!!"

model, _ = torch.hub.load(repo_or_dir='snakers4/silero-models',
                          model='silero_tts',
                          language=language,
                          speaker=model_id)

model.to(device)


# воспроизводим
def va_speak(what: str):
    audio = model.apply_tts(text=what+"..",
                            speaker=speaker,
                            sample_rate=sample_rate,
                            put_accent=put_accent,
                            put_yo=put_yo)

    sd.play(audio, sample_rate * 1.05)
    time.sleep((len(audio) / sample_rate) + 0.5)
    sd.stop()

# sd.play(audio, sample_rate)
# time.sleep(len(audio) / sample_rate)
# sd.stop()

stt

spoiler

import vosk
import sys
import sounddevice as sd
import queue
import json

model = vosk.Model("model_small")
samplerate = 16000
device = 1

q = queue.Queue()


def q_callback(indata, frames, time, status):
    if status:
        print(status, file=sys.stderr)
    q.put(bytes(indata))


def va_listen(callback):
    with sd.RawInputStream(samplerate=samplerate, blocksize=8000, device=device, dtype='int16',
                           channels=1, callback=q_callback):

        rec = vosk.KaldiRecognizer(model, samplerate)
        while True:
            data = q.get()
            if rec.AcceptWaveform(data):
                callback(json.loads(rec.Result())["text"])
            #else:
            #    print(rec.PartialResult())

config

spoiler

VA_NAME = 'Кеша'

VA_VER = "2.0"

VA_ALIAS = ('кеша', 'кеш', 'инокентий', 'иннокентий', 'кишун', 'киш', 'кишаня', 'кешечка', 'кэш', 'кэша')

VA_TBR = ('скажи', 'покажи', 'ответь', 'произнеси', 'расскажи', 'сколько', "")

VA_CMD_LIST = {
    "help": ('список команд', 'команды', 'что ты умеешь', 'твои навыки', 'навыки'),
    "ctime": ('время', 'текущее время', 'сейчас времени', 'который час'),
    "joke": ('расскажи анекдот', 'рассмеши', 'шутка', 'расскажи шутку', 'пошути', 'развесели'),
    "open_browser": ('открой браузер', 'запусти браузер', 'открой гугл хром', 'гугл хром',"Открой гугл"),
    "sreachyoutube":("Видео","Открой видео"),
    "OpenYoutube":("Открой ютуб", "запусти ютуб"),
    "VIKLKOPM":("Отключи компютер", "Выключи компютер"),
    "RAST":("Открой раст", "Включи раст"),
    "BYBIT":("Открой биржу","Открой BYBIT"),
    "zakrbrayzer":("Закрой ютуб", "Закрой браузер", "Закрой гугл"),
    "sozdatel":("Кто твой создатель?"),
    "Sverni":("Сверни окна", "Разверни окна", "Сверни", "Разверни"),
    "despetcher":("Открой диспетчер задач", "открой диспетчер", "диспетчер задач"),
    "pause":("нажми пробел", "поставь паузу", "включи фильм", "останови фильм"),
    "raskladka":("Смени язык", "смени расскладку", "поменяй расскладку"),
    "golosvvod":("Голосовой ввод", "голосовой ввод"),
    "wikipedia":("википедия")
}

Вопрос задан более двух лет назад
209 просмотров

4 комментария

Подписаться 1 Простой 4 комментария

Модератор @TosterModerator

Покажите, как вы сами пробовали решить проблему, приведите код попытки (пусть неудачной), опишите, как запускали, что ожидали и что получилось. Нам ни к чему чужие куски кода. За вас Кито вам делать «красиво» не будет.
За готовыми решениями - на фриланс. В текущем виде это не вопрос, а задание. Нарушен п.5.12 Регламента.

Написано более двух лет назад
maksim4ik69 @maksim4ik69 Автор вопроса

Модератор, Пробовал туда писать recognition_cmd, после чего хотел подставить в переменную rec.PartialResult(), перед этим импортируя rec
from stt import rec, я бы не сказал что это задания, да согласен не обьяснил как пробовал решить, за это извиняюсь я туда уже много переменых которые хоть немного имеют отношения к голосу ставил, но в даном случае я прошу даже малейшую подсказку о том что я делаю не так и тд.
Должно было найти видео в ютубе
в итоге при попытке сделать с этими перемеными выдавало разные ошибки, так же было что он уже заходил в гугл, но вводил не мой запрос а просто ["text"]
Еще раз извиняюсь, если после обьяснения немного понятней, прошу не блокировать вопрос)

Написано более двух лет назад
Модератор @TosterModerator

maksim4ik69, во-первых, не надо в комментах мне пояснения давать. Конкретику добавьте в теле вопроса.
Во-вторых, повторюсь - задавайте конкретный вопрос. Не «какую переменную впихнуть», а то вам тут насоветуют, гусары покраснеют…

Вам надо сузить вопрос до простого маленького, например «вот чего я хочу, вот так сделал, ожидал такое, а получил эдакое. Что я делаю не так?»

Написано более двух лет назад
maksim4ik69 @maksim4ik69 Автор вопроса

Модератор, Изменил вопрос

Написано более двух лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- вчера
- 92 просмотра
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 20 дек.
- 130 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 197 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 219 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 77 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 199 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 231 просмотр
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 248 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 239 просмотров
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Покажите, как вы сами пробовали решить проблему, приведите код попытки (пусть неудачной), опишите, как запускали, что ожидали и что получилось. Нам ни к чему чужие куски кода. За вас Кито вам делать «красиво» не будет.
За готовыми решениями - на фриланс. В текущем виде это не вопрос, а задание. Нарушен п.5.12 Регламента.
Модератор, Пробовал туда писать recognition_cmd, после чего хотел подставить в переменную rec.PartialResult(), перед этим импортируя rec
from stt import rec, я бы не сказал что это задания, да согласен не обьяснил как пробовал решить, за это извиняюсь я туда уже много переменых которые хоть немного имеют отношения к голосу ставил, но в даном случае я прошу даже малейшую подсказку о том что я делаю не так и тд.
Должно было найти видео в ютубе
в итоге при попытке сделать с этими перемеными выдавало разные ошибки, так же было что он уже заходил в гугл, но вводил не мой запрос а просто ["text"]
Еще раз извиняюсь, если после обьяснения немного понятней, прошу не блокировать вопрос)
maksim4ik69, во-первых, не надо в комментах мне пояснения давать. Конкретику добавьте в теле вопроса.
Во-вторых, повторюсь - задавайте конкретный вопрос. Не «какую переменную впихнуть», а то вам тут насоветуют, гусары покраснеют…

Вам надо сузить вопрос до простого маленького, например «вот чего я хочу, вот так сделал, ожидал такое, а получил эдакое. Что я делаю не так?»

Как сделать голосовой поиск в ютубе для ассистенте?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт