Как добавить явное условие при обучении модели AI?

Question

AndreiPy13 @AndreiPy13

Как добавить явное условие при обучении модели AI?

Привет! У меня есть код для обучения BERT модели. Но мои обучающие данные не сбалансированы (есть 10 категорий, в некоторых есть 100 примеров, в других - 5), я добавил class_weights в свой код, но это не дало никакого эффекта. Возможно, я могу добавить явные условия?
Например, если есть слово "привет" в тексте, то это категория "добро пожаловать". Но я не могу понять, как это сделать, может кто подскажет?

class_weights = compute_class_weight('balanced', classes=np.unique(y_train), y=y_train)
    logger.info(f"Class Weights: {class_weights}")
    class_weights = torch.tensor(class_weights, dtype=torch.float).to(device)
    criterion = nn.CrossEntropyLoss(weight=class_weights)

    # Обучение и сохранение модели
    for epoch in tqdm(range(1, epochs + 1)):
        model.train()
        loss_train_total = 0

        progress_bar = tqdm(dataloader_train, desc='Эпоха {:1d}'.format(epoch), leave=False, disable=False)
        for batch in progress_bar:
            model.zero_grad()

            batch = tuple(b.to(device) for b in batch)

            inputs = {'input_ids': batch[0],
                      'attention_mask': batch[1],
                      'labels': batch[2],
                      }

            outputs = model(**inputs)

            loss = criterion(outputs.logits, inputs['labels'])
            loss_train_total += loss.item()
            loss.backward()

            torch.nn.utils.clip_grad_norm_(model.parameters(), 1.0)

            optimizer.step()
            scheduler.step()

            progress_bar.set_postfix({'training_loss': '{:.3f}'.format(loss.item() / len(batch))})

        # Сохраняем состояние модели BERT
        current_path = Path.cwd()
        torch.save(model.state_dict(), current_path / 'app' / 'api' / 'ai' / 'trained_models' / 'new_models' /
                   f'fine_tuned_{model_name}_BERT_epoch_{epoch}.model')

        logger.info(f'\nЭпоха {epoch}')

        loss_train_avg = loss_train_total / len(dataloader_train)

        val_loss, predictions, true_vals = evaluate(dataloader_validation)
        val_f1 = f1_score_func(predictions, true_vals)
        accuracy_per_class(predictions, true_vals)
        logger.info(f'Функция потерь при обучении: {loss_train_avg}')
        logger.info(f'Функция потерь при валидации: {val_loss}')
        logger.info(f'F1-мера при валидации: {val_f1}')

Вопрос задан более двух лет назад
131 просмотр

Комментировать

Подписаться 1 Средний Комментировать

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Почему консольная программа перестает работать спустя время?
- 1 подписчик
- вчера
- 336 просмотров
1

ответ
Python

Простой
Как делать удаленную печать на python?
- 1 подписчик
- вчера
- 89 просмотров
2

ответа
Python

Простой
Как импортировать модуль из git?
- 1 подписчик
- 07 авг.
- 128 просмотров
0

ответов
Видео

+1 ещё

Простой
Нейросеть для перевода видео?
- 2 подписчика
- 07 авг.
- 251 просмотр
2

ответа
Python

+3 ещё

Простой
Как с помощью Kaspersky Security Center запустить скрипт?
- 1 подписчик
- 04 авг.
- 143 просмотра
0

ответов
Python

+2 ещё

Простой
Как в группе Telegram ответить скриптом на сообщение пользователя, на которое я отвечал сообщением, которое как раз таки запустило скрипт (telethon)?
- 1 подписчик
- 04 авг.
- 162 просмотра
1

ответ
Python

Простой
Почему у меня программа вообще не реагирует на свойства в python?
- 1 подписчик
- 02 авг.
- 218 просмотров
3

ответа
Дизайн

+4 ещё

Простой
Чем генерировать текстуры материалов?
- 1 подписчик
- 02 авг.
- 121 просмотр
1

ответ
Python

Простой
Python клон проекта, как создать?
- 1 подписчик
- 01 авг.
- 192 просмотра
1

ответ
Python

+2 ещё

Простой
Как добавить опцию в контекстное меню для Internet Shortcuts?
- 1 подписчик
- 30 июл.
- 136 просмотров
1

ответ
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

Answer 1 · 2023-07-02 21:59:13

Явные условия (детерминистические) это не про машинное обучение. Сама суть машинного обучения это обучение без задания явных инструкций.

Твоя проблема, большая называется "несбалансированные классы". 5 в одном 100 в другом это безнадега, модель по умолчанию имеет большую предрасположенность, что мешает обучению.

Это распространенная проблема и к сожалению простого решения (не имеет). Существуют разные стратегии, как с этим бороться, и надо пробовать, что будет работать.

Советую изучить вот эту статью на эту тему внимательно, и запастись терпением. Вот эта статья с медиума (открывается только через vpn) по крайней мере у меня, там тоже BERT и тоже решается проблема с не сбалансированным классами. Есть код. Но повторю проблема решается разными стратегиями препроцессинга (первая статья).

Как добавить явное условие при обучении модели AI?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт