Scheduler'ы в pytorch слишком сильно занижают lr?

Question

ermak148 @ermak148

Python

Scheduler'ы в pytorch слишком сильно занижают lr?

Переучиваюсь с tensorflow на torch. Вспомнил про какие-то scheduler'ы при обучении gpt-2. Написал функцию и засунул в LambdaLR. Отслеживаю lr во время обучения и вижу что он очень сильно упал (0.0000005) при определенном минимуме в самой функции. Такое же происходит с StepLR ( другие не пробовал ) (Тыкал на оптимизаторах AdamW и RMSprop) (функция с обычным принтом в тесте отлично работала!).
Сама функция и остальной код:

def get_lr(epoch):
    min_lr = 0.00001
    max_lr = 0.001
    step = 0.00002

    return max(min_lr, max_lr - step * epoch)
optim = torch.optim.RMSprop(model.parameters(), lr=0.001)
# scheduler = LambdaLR(optim, get_lr)
with tqdm.tqdm(total=epochs, postfix={"Loss": 0, "LR": 0.0009}, dynamic_ncols=True) as pbar:
    for epoch in range(epochs):
        for inputs, targets in dataloader:
            # print(inputs, targets)
            optim.zero_grad()
            out = model(inputs)
            loss = criterion(out, targets)
            loss.backward()
            optim.step()
        pbar.update(1)
        pbar.set_postfix({"Loss": str(loss.item()), "LR": "{:.10f}".format(optim.param_groups[0]['lr'])})
        # print(f"Epoch: {epoch}. Loss: {loss.item()}")
        # scheduler.step()

Хелп!

Вопрос задан более года назад
140 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как бороться с отступами в сформированном шаблоне Django python?
- 2 подписчика
- 3 часа назад
- 74 просмотра
1

ответ
Python

+2 ещё

Простой
Как правильно спроектировать эту функцию?
- 1 подписчик
- 16 часов назад
- 99 просмотров
2

ответа
Python

+1 ещё

Простой
Что не так с моими асинхронными запросами?
- 1 подписчик
- 20 авг.
- 158 просмотров
0

ответов
Python

Простой
Как в питоне генерировать (создавать+заполнять значениями по умолчанию) вложенный словарь так, чтобы вложенные элементы не были копиями друг друга?
- 1 подписчик
- 20 авг.
- 132 просмотра
1

ответ
Python

+1 ещё

Простой
Из-за чего возникает ошибка неверный дескриптор?
- 1 подписчик
- 19 авг.
- 108 просмотров
1

ответ
Python

Простой
Непонимание ошибки yolo8?
- 1 подписчик
- 19 авг.
- 71 просмотр
0

ответов
Python

+1 ещё

Простой
Как грамотно изначально сделать телеграмм бота на Python с помощью aiogram чтобы выдерживал как минимум 10к пользователи и можно было масштабировать?
- 1 подписчик
- 18 авг.
- 240 просмотров
2

ответа
Python

Простой
Как сделать lock для двух асинхронных программ?
- 1 подписчик
- 18 авг.
- 136 просмотров
1

ответ
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 16 авг.
- 147 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 146 просмотров
1

ответ
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

Answer 1 · 2023-12-10 15:09:02

Lapita12 @Lapita12

Тесты, тесты?

def get_lr(epoch):
    min_lr = 0.00001
    max_lr = 0.001
    step = 0.00002

    return max(min_lr, max_lr * (1 - step * epoch)**2)

Ответ написан более года назад

Комментировать

Scheduler'ы в pytorch слишком сильно занижают lr?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт