Какую и как дообучить модель машинного перевода?

Question

Xiran @Xiran

Какую и как дообучить модель машинного перевода?

Мне нужно дообучить модель машинного перевода с английского на русский для перевода текстов со специфическим слэнгом. У меня есть два текстовых файла текстов со слэнгом на русском переводе и английском соответственно. Не знаю, можно ли это назвать датасетом. Можно взять какую-нибудь модель для перевода ru-en/en-ru и "докинуть" в нее свой датасет?

Вопрос задан 29 сент. 2024
1176 просмотров

Комментировать

Подписаться 6 Простой Комментировать

Решения вопроса 1

5 комментариев

Xiran @Xiran Автор вопроса

И какого размера датасет? Слэнговых слов ~40, сленг cs:go, cs2

Написано 30 сент. 2024
rPman @rPman

Xiran, ой нет, 40 примеров это для обучения недостаточно, мало того, даже для finetuning уже предобученной может оказаться недостаточно.

Пальцем в небо, может это стрельба по воробьям из пушки, но, gpt сетки completion можно обучить на свой формат вход-выход за разумные ресурсы (сотни баксов арендуя на том же vast.ai была статья как llama 8b тюнили на более сложную задачу),.. эти сетки умнее простых переводчиков, могут догадаться о стилистике.

pretrained completion не требует особого системного промпта (вопрос экспериментов), но очень хорошо работают в multishot режиме, когда контекстное окно заполняют примерами в виде "вопрос - ответ - вопрос - ответ - вопрос -" и вот последний вопрос и будет твой требуемый, а все предыдущие твои 40 примеров.

Я смотрел какую то презентацию яндекса еще времен до бума chatgpt35 там рассказывали про тюнинг весов токенизатора, когда сетку как бы обучают, заморозив все веса сети но разрешив менять веса токенов запроса (собственно обучение идет, подставляя системный промпт + впрос + известный ответ, но тюнят токенизер, это как бы подстраивает сетку под конкретный промпт, и это хорошо работало даже со считанными десятками примеров)

Написано 30 сент. 2024
Xiran @Xiran Автор вопроса

rPman, не примеров, а слов) примеров нужно примерно накопать 2-3 тысячи, я беру их из субтитров

Написано 30 сент. 2024
Xiran @Xiran Автор вопроса

rPman, все больше склоняюсь к готовым типа llama

Написано 30 сент. 2024
rPman @rPman

Xiran, нужны именно примеры фраз, хотя gpt достаточно умные чтобы используя уже имеющийся опыт перевода понимать и это

Написано 30 сент. 2024

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Видео

+1 ещё

Простой
Нейросеть для перевода видео?
- 2 подписчика
- 07 авг.
- 276 просмотров
2

ответа
Дизайн

+4 ещё

Простой
Чем генерировать текстуры материалов?
- 1 подписчик
- 02 авг.
- 135 просмотров
1

ответ
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 217 просмотров
3

ответа
Искусственный интеллект

Простой
Необходим инструмент либо схема (nocode) для поиска решений по доработке химических рецептов продуктов (не пищевых). Необходим пилот, кто сталкивался?
- 1 подписчик
- 14 июл.
- 105 просмотров
0

ответов
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 144 просмотра
2

ответа
Python

+1 ещё

Простой
Как тренировать Yolo, размер датасета, итоговый loss?
- 2 подписчика
- 13 июл.
- 1002 просмотра
2

ответа
Языки программирования

+1 ещё

Средний
Насколько TypeScript, C# и C++ способны заменить Python при разработке искусственного интелекта?
- 1 подписчик
- 12 июл.
- 193 просмотра
3

ответа
Python

+1 ещё

Средний
Как генерировать качественные изображения в stable diffusion используя python?
- 2 подписчика
- 05 июл.
- 440 просмотров
0

ответов
Искусственный интеллект

Простой
PHP+Postgres в Cursor?
- 3 подписчика
- 04 июл.
- 1220 просмотров
1

ответ
Искусственный интеллект

Средний
Как обучить нейросеть на своих данных?
- 2 подписчика
- 21 июн.
- 526 просмотров
1

ответ
Показать ещё Загружается…

С++ developer

КОД ГРИН Инжиниринг • Санкт-Петербург

от 30 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Промпт-инженер/Prompt-инженер

Мособлгаз • Москва

от 250 000 до 300 000 ₽

Answer 1 · 2024-09-29 17:52:45

Не разбираюсь в вопросе, но когда читал про это, самое простое что можно сделать, взять обученную сетку у фейсбука, и изучить документацию по повторению их результата но уже на своих данных
https://github.com/facebookresearch/fairseq/tree/m...

Какую и как дообучить модель машинного перевода?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт