Задать вопрос

OlegErmakov @OlegErmakov

нейронные-сети

Нейронные сети

Как из RobertaTokenizer сделать XLMRobertaTokenizer?

Появилась задача выпендриться моделью для векторизации текста с пониманием сематики (или как там) текста. Решил использовать XLMRoberta с 800млн параметрами как основу и обучить ее на огрызке оскара. Если хотите мне предъявить в неправильной модели - предъявляйте, я не силен в эмбеддингах текста. Так же нужно сделать выбор: Либо использовать XLMRobertaForMaskedLM, которую я вообще не понимаю как использовать в эмбеддинге и + использовать logits.mean, что, как я думаю, угробит результат , либо XLMRobertaForTextClassification, где num_labels = размер эмбеддиннга, но я не знаю где брать нужный датасет, либо XLMRoberaModel, где есть удобный pooled_output, но где брать данные я тоже не знаю. В общем, есть просто файл на 17 гигов со сплошным текстом и задача получить модель, которая понимает сематику и дает хорошие эмбеддинги. Так вот, про основной вопрос: приглянулся мне вокаб от модельки ai-forever/ruRoberta-larg, но как преобразовать токенизатор без понятия

Вопрос задан более года назад
214 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее
Skillbox

Профессия Machine Learning Engineer

12 месяцев

Далее
Центр непрерывного образования ФКН НИУ ВШЭ

Глубинное обучение

10 недель

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 114 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 92 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 85 просмотров
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 67 просмотров
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 97 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 82 просмотра
1

ответ
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1368 просмотров
5

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 249 просмотров
3

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 278 просмотров
3

ответа
Нейронные сети

Простой
Как настроить оркестрацию вайбкодинга?
- 2 подписчика
- 21 сент.
- 440 просмотров
3

ответа
Показать ещё Загружается…

Frontend Developer/ Vue.js

DevTeam.Space • Москва

от 1 000 до 3 000 $

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽