Какую и как дообучить модель машинного перевода?

Мне нужно дообучить модель машинного перевода с английского на русский для перевода текстов со специфическим слэнгом. У меня есть два текстовых файла текстов со слэнгом на русском переводе и английском соответственно. Не знаю, можно ли это назвать датасетом. Можно взять какую-нибудь модель для перевода ru-en/en-ru и "докинуть" в нее свой датасет?
  • Вопрос задан
  • 1123 просмотра
Решения вопроса 1
@rPman
Не разбираюсь в вопросе, но когда читал про это, самое простое что можно сделать, взять обученную сетку у фейсбука, и изучить документацию по повторению их результата но уже на своих данных
https://github.com/facebookresearch/fairseq/tree/m...
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы