Scheduler'ы в pytorch слишком сильно занижают lr?

Question

ermak148 @ermak148

Python

Scheduler'ы в pytorch слишком сильно занижают lr?

Переучиваюсь с tensorflow на torch. Вспомнил про какие-то scheduler'ы при обучении gpt-2. Написал функцию и засунул в LambdaLR. Отслеживаю lr во время обучения и вижу что он очень сильно упал (0.0000005) при определенном минимуме в самой функции. Такое же происходит с StepLR ( другие не пробовал ) (Тыкал на оптимизаторах AdamW и RMSprop) (функция с обычным принтом в тесте отлично работала!).
Сама функция и остальной код:

def get_lr(epoch):
    min_lr = 0.00001
    max_lr = 0.001
    step = 0.00002

    return max(min_lr, max_lr - step * epoch)
optim = torch.optim.RMSprop(model.parameters(), lr=0.001)
# scheduler = LambdaLR(optim, get_lr)
with tqdm.tqdm(total=epochs, postfix={"Loss": 0, "LR": 0.0009}, dynamic_ncols=True) as pbar:
    for epoch in range(epochs):
        for inputs, targets in dataloader:
            # print(inputs, targets)
            optim.zero_grad()
            out = model(inputs)
            loss = criterion(out, targets)
            loss.backward()
            optim.step()
        pbar.update(1)
        pbar.set_postfix({"Loss": str(loss.item()), "LR": "{:.10f}".format(optim.param_groups[0]['lr'])})
        # print(f"Epoch: {epoch}. Loss: {loss.item()}")
        # scheduler.step()

Хелп!

Вопрос задан 10 дек. 2023
81 просмотр

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Простой
Как в строке вывести соответствующее название атрибута в Python?
- 1 подписчик
- 11 часов назад
- 76 просмотров
2

ответа
Python

Простой
Как декодировать XmlLayer из пакета с помощью Python, конвертируя в JSON?
- 1 подписчик
- 12 часов назад
- 43 просмотра
0

ответов
Python

Простой
Задание из практикума, не могу сделать уже целую неделю. Какие есть ошибки?
- 1 подписчик
- 15 часов назад
- 72 просмотра
1

ответ
Python

+2 ещё

Средний
Как открыть четыре приложения Duolingo и создать 4 курсора на Мас, которые асинхронно управляются через pyautogui (Python)?
- 1 подписчик
- вчера
- 82 просмотра
1

ответ
Python

+1 ещё

Простой
Почему бот перестал переключаться по бинду?
- 1 подписчик
- вчера
- 44 просмотра
0

ответов
Python

Простой
Появилась проблема при запуске приложения Python в Termux?
- 1 подписчик
- вчера
- 36 просмотров
2

ответа
Python

+1 ещё

Простой
Как правильно создать товар через Ozon Seller API?
- 1 подписчик
- вчера
- 50 просмотров
1

ответ
Python

+1 ещё

Простой
Как автоматически удалять старые процессы chrome?
- 1 подписчик
- вчера
- 58 просмотров
1

ответ
Python

+2 ещё

Простой
Как добавить в установщик своей программы Opera?
- 1 подписчик
- вчера
- 51 просмотр
1

ответ
Python

+1 ещё

Простой
Где и как в Pycharm можно проанализировать код на вызовы или использование не объявленных методов\полей?
- 1 подписчик
- вчера
- 38 просмотров
2

ответа
Показать ещё Загружается…

Python разработчик (ОФИС)

SpectrumData • Екатеринбург

от 150 000 до 250 000 ₽

Python-разработчик

Точка

До 380 000 ₽

Python разработчик

Гринатом • Москва

от 150 000 ₽

Верстка дизайна

26 июл. 2024, в 23:29

15000 руб./за проект

Заставить работать приложение на react+php (найти активацию)

26 июл. 2024, в 22:36

5000 руб./за проект

Сделать логотип в векторе

26 июл. 2024, в 22:02

2000 руб./за проект

Answer 1 · 2023-12-10 15:09:02

Lapita12 @Lapita12

Тесты, тесты?

def get_lr(epoch):
    min_lr = 0.00001
    max_lr = 0.001
    step = 0.00002

    return max(min_lr, max_lr * (1 - step * epoch)**2)

Ответ написан 10 дек. 2023

Комментировать

Scheduler'ы в pytorch слишком сильно занижают lr?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт