Как эффективно загружать картинки при обучении в PyTorch?

Question

Матвей Nosurname @matweykai

Standart coder ; )

Машинное обучение

Как эффективно загружать картинки при обучении в PyTorch?

Решаю соревнование на Kaggle, раньше я не работал с картинками, кроме заданий на курсах. Решаю задачу классификации изображений, их примерно 9 ГБ (415к файлов). Моя модель очень долго обучается, и я заметил, что основное время уходит на загрузку данных. Сейчас я делаю это так:

class MushroomDataset(Dataset):
    def __init__(self, mapping_ds: pd.DataFrame, pict_folder: str, transforms=None):
        self.mapping_ds = mapping_ds
        self.pict_folder = pict_folder
        self.transforms = transforms
        
    def __getitem__(self, ind: int):        
        cur_obj = self.mapping_ds.iloc[ind]
        
        pict_path = path.join(self.pict_folder, cur_obj.image_path[:-4] + '.jpg')
        
        img = Image.open(pict_path)
        
        if self.transforms:
            img = self.transforms(img)
            
        return img, cur_obj.class_id
    
    def __len__(self):
        return self.mapping_ds.shape[0]

Модель проходит одну эпоху за час, что мне кажется ненормальным. Если интересно, то код для обучения такой:

def train_model(model, optimizer, loss, train_loader, val_loader, scheduler=None, epoch_num=10):
    loss_history = list()
    train_hist = list()
    val_hist = list()
    
    model.to(device)
    
    for epoch_ind in range(epoch_num):
        model.train()
        
        corr_predicted_obj = 0
        loss_accum = 0
        # Training
        for i_step, (x, y) in enumerate(train_loader, 1):
            x = x.to(device)
            y = y.to(device)
            
            pred = model(x)
            
            loss_val = loss(pred, y)
            
            optimizer.zero_grad()
            loss_val.backward()
            optimizer.step()
            
            loss_accum += loss_val
            
            pred_labels = torch.argmax(pred, dim=1)
            corr_predicted_obj += torch.sum(pred_labels == y)
            
            
        loss_history.append(loss_accum / i_step)
        train_hist.append(corr_predicted_obj / len(train_loader.dataset))
        
        # Validation
        val_corr_predicted_obj = 0
        
        model.eval()
        
        for x, y in val_loader:
            x = x.to(device)
            y = y.to(device)
            
            pred = model(x)
            
            pred_labels = torch.argmax(pred, dim=1)

            val_corr_predicted_obj += torch.sum(pred_labels == y)
        
        val_hist.append(val_corr_predicted_obj / len(val_loader.dataset))
        
        # Printing model progress
        print(f"Epoch -> {epoch_ind + 1}  Loss value: {round(loss_history[-1].item(), 5)}  " + \
              f"Train score: {round(train_hist[-1].item(), 4) * 100} %  " + \
              f"Validation score: {round(val_hist[-1].item(), 4) * 100}")
        
        # Scheduler step
        if scheduler:
            scheduler.step()
        
    return loss_history, train_hist, val_hist

А модель вот:

frez_model = models.densenet121(pretrained=True)

for layer in frez_model.parameters():
    layer.requires_grad = False

frez_model.classifier = nn.Linear(frez_model.classifier.in_features, len(train_ds.class_id.unique()))

lr = 1e-2

optimizer = optim.SGD(frez_model.parameters(), lr=lr)
scheduler = optim.lr_scheduler.ExponentialLR(optimizer, gamma=0.5)

loss = nn.CrossEntropyLoss()

loss_history, train_hist, val_hist = train_model(frez_model, optimizer, loss, train_loader, valid_loader, scheduler=scheduler)

Перерыл уже множество Kaggle Kernel на этом и похожем соревновании(тоже классификация картинок и возникает та же проблема). Как обучать всё это дело быстрее? (Если что обучение происходит также на железе Kaggle и на их GPU)

Вопрос задан более года назад
102 просмотра

2 комментария

Подписаться 1 Средний 2 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

IT-образование

+3 ещё

Простой
Какая есть литература полезная и понятная по Data Science на русском?
- 3 подписчика
- вчера
- 947 просмотров
1

ответ
Машинное обучение

+2 ещё

Простой
Создание нейронной сети для определения сортов яблок. Как осуществить?
- 1 подписчик
- 11 апр.
- 82 просмотра
0

ответов
Машинное обучение

+1 ещё

Средний
Как работает адаптивный бустинг для регрессии?
- 1 подписчик
- 05 апр.
- 24 просмотра
0

ответов
Машинное обучение

+1 ещё

Средний
Чем отличается стекинг от блендинга?
- 1 подписчик
- 02 апр.
- 48 просмотров
1

ответ
Машинное обучение

+2 ещё

Простой
Что технически(какие it решения, технологический стек) нужны для создания ии ,который сможет на основе жалоб ставить диагноз?
- 1 подписчик
- 21 мар.
- 112 просмотров
3

ответа
Машинное обучение

Средний
Какой метод машинного обучения применить и как?
- 1 подписчик
- 19 мар.
- 58 просмотров
1

ответ
Машинное обучение

Средний
Как исправить переобучение сверточной нейронной сети(keras)?
- 1 подписчик
- 18 мар.
- 47 просмотров
0

ответов
Машинное обучение

+2 ещё

Простой
Как выбрать своё направление из двух совершенно разных?
- 1 подписчик
- 16 мар.
- 96 просмотров
2

ответа
Машинное обучение

+1 ещё

Сложный
Как реализовать обучение нейросети в реальном времени?
- 2 подписчика
- 11 мар.
- 160 просмотров
2

ответа
Машинное обучение

Простой
Почему loss не уменьшается?
- 1 подписчик
- 03 мар.
- 46 просмотров
1

ответ
Показать ещё Загружается…

Data Scientist (Финтех)

Intelinvest

от 60 000 ₽

Senior ML Engineer (Computer Vision)

Gradient

от 450 000 ₽

Python/Django-разработчик (mobile+AI)

4Taps AI • Тольятти

от 150 000 до 250 000 ₽

Обработать массив фотографий

19 апр. 2024, в 08:46

5000 руб./за проект

Скрыть / убрать лишние поля в форме заказа

19 апр. 2024, в 07:30

1500 руб./в час

Взлом автомобильной программы

19 апр. 2024, в 05:01

999999 руб./за проект

Надо много оперативки, чтобы всё туда влезло. У тебя 9Гб джпегов, поэтому сырых пикселей будет гигов 50.
freeExec, то есть у других участников есть такие мощности? Я думал что все кроме топов могут обойтись обычными Kaggle Kernel'aми

Как эффективно загружать картинки при обучении в PyTorch?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт