Можно ли научить бот разговаривать на редком языке?
Можно ли научить чатбот редкому языку (в моем случае интересует якутский, которым я владею)? Под словом редкий подразумеваются языки которых , например, нет в гугл переводчике.
Я хочу написать простой чатбот который сможет разговаривать со мной на якутском. Очевидно, что тут не обойтись без алгоритмов и основ машинного обучения. Тогда подойдет ли для этого популярный chatterbot?
sim3x, Но ведь боты до ML просто имели большую базу данных со всеми потенциальными вопросами и ответами. Как без машинного обучения может бот учиться отвечать на фразы не выбирая рандомно из готовых ответов?
Не ужели этот вопрос "Сложный"?
ЧатБот это просто программа ввода-вывода.
И можно его запрограммировать читать и писать на якутском.
А вот машинное обучение не обязательно хотя воплотить не так уж и сложно.
Тебе придется самому с нуля создавать синтаксический и семантический анализатор.
А если лень то можеш создать чат бота на английском и прикрутить к нему переводчик
хотя его тебе тоже придётся написать самому, ведь ты сказал "нет в гугл переводчике".
Я бы подсказал как бы проще реализовать но я вообще не знаю якутский.
P.S. Интересная идея создать бота на малоизвестном языке, а то везде английский, китайский ну и ещё несколько...
Спасибо за такой обширный ответ!
Тут например выше писали, что для машинного обучения потребуется огромное количество текстов.
Да, готовых модулей или переводчиков с якутского нет, поэтому и пришло в голову, что тут без машинного обучения не обойтись.
Тебе придется самому с нуля создавать синтаксический и семантический анализатор.
Это ведь можно сделать в той же программе ЧатБот? Не знаю даже с чего начать..
Кстати, язык малоизвестный, но все же на нем разговаривают около 500,000 человек :) Вот и подумала, что неплохо бы написать чатбот знающий якутский, потом может кому пригодится.
milayeva, "Это ведь можно сделать в той же программе ЧатБот?" - (Если речь идет о том-же, о чем и в вопросе, т.е. о программе chatterbot то) - нет, конечно. Семантический и синтаксический анализатор пишется для каждого языка отдельно. Т.е. для якутского нельзя применить не то что английскую версию, но даже русскую.
И да, "огромное количество текстов" также придется готовить самой.
dmshar, я просто очень далека от machine learning, поэтому когда гуглю про боты чаще всего выходит chatterbot, с помощью которого бот можно научить любому языку т.к. модуль чаттербота language independent. я просто подумала, что значит и семантический и синтаксический анализатор можно каким то образом с помощью этого модуля и реализовать, раз language independent. но получается что нет :)