Задать вопрос

OlegErmakov @OlegErmakov

нейронные-сети

Нейронные сети

Как из RobertaTokenizer сделать XLMRobertaTokenizer?

Появилась задача выпендриться моделью для векторизации текста с пониманием сематики (или как там) текста. Решил использовать XLMRoberta с 800млн параметрами как основу и обучить ее на огрызке оскара. Если хотите мне предъявить в неправильной модели - предъявляйте, я не силен в эмбеддингах текста. Так же нужно сделать выбор: Либо использовать XLMRobertaForMaskedLM, которую я вообще не понимаю как использовать в эмбеддинге и + использовать logits.mean, что, как я думаю, угробит результат , либо XLMRobertaForTextClassification, где num_labels = размер эмбеддиннга, но я не знаю где брать нужный датасет, либо XLMRoberaModel, где есть удобный pooled_output, но где брать данные я тоже не знаю. В общем, есть просто файл на 17 гигов со сплошным текстом и задача получить модель, которая понимает сематику и дает хорошие эмбеддинги. Так вот, про основной вопрос: приглянулся мне вокаб от модельки ai-forever/ruRoberta-larg, но как преобразовать токенизатор без понятия

Вопрос задан более года назад
214 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее
Нетология

Бизнес-аналитик

7 месяцев

Далее
Skillbox

Профессия Machine Learning Engineer

12 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 253 просмотра
1

ответ
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 120 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 96 просмотров
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 86 просмотров
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 72 просмотра
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 98 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 82 просмотра
1

ответ
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1392 просмотра
5

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 256 просмотров
3

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 278 просмотров
3

ответа
Показать ещё Загружается…

ML-разработчик (Machine Learning)

DevTeam.Space

от 2 000 до 4 000 $

Аналитик 1С (телеком)

LIAN • Москва

от 270 000 до 300 000 ₽

Frontend Developer

Aporia • Севастополь

До 150 000 ₽