Задать вопрос

Евгений Орлов

NLP lead

2

вклад
0

вопросов
5

ответов
20%

решений

Ответы

Как обучить локальную модель своему голосу?

Евгений Орлов @Mentalitet Куратор тега Искусственный интеллект
NLP lead

Эта задача называется клонирование голоса, дообучать модель для этого не нужно
Можно воспользоваться одной из открытых моделей по клонированию голоса, например
https://github.com/myshell-ai/OpenVoice

Ответ написан 03 апр.

Комментировать

Комментировать
Какая локальная нейросеть учится на моей базе документов?

Евгений Орлов @Mentalitet Куратор тега Искусственный интеллект
NLP lead

Без рага эта задача адекватно не решается, тк несколько тысяч страниц текста - это большой объем информации, который просто не влезет в контекстное окно любой модели, которую можно поднять самостоятельно
Соответственно, нужно прорабатывать:
- то как перегнать весь материал например в markdown
- как нарезать материал (чанкование или полуавтоматически или еще какие-то стратегии)
- какую модель использовать чтобы векторизовать материал
- какие-то еще вещи, связанные с улучшением рага

Раг при хорошей настройке позволяет добиться качества 90-95% точности ответов

По поводу поднятия сетки на арендуемом сервере:
в значительной степени это вопрос бюджета, тк чем больше сетка, тем больше нужно памяти GPU, чтобы она работала
Например, для поднятия deepseek r1 нужно 1.5 тб видеопамяти
при том, что популярная видюха, которую можно найти в клауде - это Nvidia H100 с 80гб памяти за ... тысяч 300 р в месяц стоимости аренды, на 1.5тб сколько будет стоить сервер предлагаю пересчитать самостоятельно :)
Сетки начального уровня с 8млрд параметров можно запустить на чем то с 24гб видеопамяти, но и качество ответов будет ниже (даже при условии, что раг будет идеально подтягивать информацию)

Ответ написан 03 апр.

2 комментария

2 комментария
Какое устройство купить для перевода речи в реальном времени?

Евгений Орлов @Mentalitet Куратор тега Искусственный интеллект
NLP lead

Стоит понимать, что это без интернета работать не будет, тк вычисления проводятся не на очках.
А значит это происходит на стороне сервера производителя и стоит проверять доступ из РФ, тк эта фича может быть банально заблокирована территориально

Ответ написан 11 мар.

1 комментарий

1 комментарий
ИИ в строительной отрасли, какой выбрать?

Евгений Орлов @Mentalitet Куратор тега Искусственный интеллект
NLP lead

Вопрос в меньшей степени лежит на стороне выбора модели (хотя это тоже), тк ни одна модель сейчас не способна взять одну большую задачу и решить ее от начала и до конца. Даже чатгпт и прочие большие коммерческие модели с наилучшим качеством ответов.
Основное - это выделить четкие границы, в которых будет проводиться работа
Если составляем документ, то что на вход? Какого формата? Какие этапы обработки? Что на выход?
И так по любой вашей инициативе. Лишь разложив процесс на мелкие составляющие и максимально упростив каждый из этапов для ЛЛМ, уже можно пробовать собрать пайплайн, который с бОльшей вероятностью приведет к успеху.
Также, крайне важным составляющим успеха является технология Structured Output, которая помогает доставать из модели более детерминированные ответы и улучшать ответы даже маленьких моделей за счет того что мы можете направлять модель в какую сторону ей нужно думать

Ответ написан 28 февр.

Комментировать

Комментировать
Почему MidJourney и другие ИИ изменяют мою исходную картинку?

Евгений Орлов @Mentalitet
NLP lead

В такой постановке, пока что ни одна сетка не может выполнить эту задачу
Здесь нужно применять другие подходы, при которых контроль над изображением гораздо больше, чем просто управление через промпт
Например, можно применить подход inpaint - в нем генерация происходит только для отдельных элементов изображения, а не генерится заново все изображение

Ответ написан 28 февр.

Комментировать

Комментировать

Самые активные сегодня

Илья Рупасов
- 7 ответов
- 0 вопросов
Дерек Крис
- 0 ответов
- 2 вопроса
Valdemar Smörman
- 2 ответа
- 0 вопросов
vylek
- 2 ответа
- 0 вопросов
Михаил Лялин
- 2 ответа
- 0 вопросов
VictorIousMagnificent
- 0 ответов
- 1 вопрос

Как обучить локальную модель своему голосу?

Какая локальная нейросеть учится на моей базе документов?

Какое устройство купить для перевода речи в реальном времени?

ИИ в строительной отрасли, какой выбрать?

Почему MidJourney и другие ИИ изменяют мою исходную картинку?

Войдите на сайт