Я пытаюсь решить аналогичную проблему
dp_tutorials/Tutorial_3_RU_Fine_tuning_BERT_classifier.ipynb at master · deepmipt/dp_tutorials · GitHub.
(Multi class sentimen classifier), единственное, датасет мой на русском, соответственно я скачал RuBert и поменял некоторые моменты конфига типа пути к датасету, разделитель.
Dataset выглядит вот таким образом:
content emotions
0 Обычная семья: муж - в море, жена - с маленьки… smile
1 Я знаком с этой конторой и обхожу ее стороной,… angry
2 Нужна мне была квартира надолго(около года) по… smile
3 Мой друг: - Не корми мою собаку сыром у неё п… smile
4 Твит Маска: «Если жизнь - это компьютерная игр… smile
Я все делаю точно также как на туториале но именно когда подгружаю данный датасет + rubert он у меня run out of RAM memory, однако когда использую BERT-base, English, uncased, 12-layer + датасет на английском, все нормально грузится и тренится. Не могу понять в чем может быть проблема. Не могли бы подсказать что я делаю не правильно? Вот код если хотите взглянуть: BERT/Ru_Bert.ipynb at main · MuhammedTech/BERT · GitHub
Спасибо заранее