Как в tensorflow построить модель с несколькими выходами?

Question

Семен @GSimonX37

Нейронные сети

Как в tensorflow построить модель с несколькими выходами?

Необходимо создать модель, которая получает изображение постера фильма и возвращает возрастной рейтинг (многоклассовая классификация) и список жанров (классификация по нескольким меткам).

Код модели:

class NNetwork(Model):
    def __init__(self, rating: int, genres: int):
        super(NNetwork, self).__init__()
        self.rescaling = Rescaling(1.0 / 255.0)

        self.convolution = [
            Conv2D(16, 3, padding='same', activation='relu'),
            Conv2D(32, 3, padding='same', activation='relu'),
            Conv2D(64, 3, padding='same', activation='relu')
        ]
        self.pooling = [
            MaxPooling2D(),
            MaxPooling2D(),
            MaxPooling2D()
        ]
        self.flatten = Flatten()

        self.dense = [
            Dense(128, activation='relu'),
            Dense(rating, activation='softmax'),
            Dense(genres, activation='softmax')
        ]

    def call(self, images: Tensor, training=None, **kwargs) -> tuple[Tensor, Tensor]:
        x = self.rescaling(images)

        for i in range(3):
            x = self.convolution[i](x)
            x = self.pooling[i](x)

        x = self.flatten(x)

        x = self.dense[0](x)

        rating = self.dense[1](x)
        genres = self.dense[2](x)

        return rating, genres

Код функции потерь:

def loss(true: Tensor,
         predict: Tensor) -> Tensor:
    
    categorical = CategoricalCrossentropy(
        reduction=None
    )

    loss = tf.reduce_mean(categorical(
        y_true=true,
        y_pred=predict
    ))

    return loss

Код цикла обучения:

@tf.function
def train_step(images_batch, rating_batch, genres_batch):
    with tf.GradientTape() as tape:
        rating_predict, genres_predict = model(images_batch)
        
        rating_loss = loss(rating_batch, rating_predict)
        genres_loss = loss(genres_batch, genres_predict)
        
    gradients = tape.gradient([rating_loss, genres_loss], model.trainable_variables)
    optimizer.apply_gradients(zip(gradients, model.trainable_variables))

    rating_score.update_state(rating_batch, rating_predict)
    genres_score.update_state(genres_batch, genres_predict)
    
    return rating_loss, genres_loss

Код основного цикла:

for n in range(EPOCHS):
    total_loss = 0
    total_rating_loss = 0
    total_genres_loss = 0
    
    for inputs, outputs in train:
        images_batch = inputs['image']
        rating_batch = outputs['rating']
        genres_batch = outputs['genres']
        
        rating_loss, genres_loss = train_step(images_batch, rating_batch, genres_batch)

        total_loss += (rating_loss + genres_loss)
        total_rating_loss += rating_loss
        total_genres_loss += genres_loss
    
    print(f'EPOCHS: {n} - total_loss: {total_loss.numpy()}, total_rating_loss: {total_rating_loss.numpy()}, total_genres_loss: {total_genres_loss.numpy()}')

Процесс обучения запускается, но функция потерь на каждой эпохе огромная, 10 в 15 степени. Значит алгоритм обучения составлен неверно.

Я предполагаю в чем может быть проблема:
1. Неверно выбрана или оформлена функция потерь.
2. Неверно вычисляются и применяются градиенты.

В чем может быть еще причина такой большой функции потерь?

Вопрос задан более года назад
101 просмотр

7 комментариев

Подписаться 1 Средний 7 комментариев

mayton2019 @mayton2019
А что здесь происходит? Можешь обычным человеческим языком рассказать?

def loss(true: Tensor, predict: Tensor) -> Tensor: .....
Написано более года назад
Семен @GSimonX37 Автор вопроса
mayton2019, я вычисляю функцию потерь.

Вызываю ее на каждом шаге (батче) для каждого выхода:

rating_loss = loss(rating_batch, rating_predict) genres_loss = loss(genres_batch, genres_predict)
Написано более года назад
Семен @GSimonX37 Автор вопроса

mayton2019, возможно я неправильно считаю среднее значение (так как передается батч из 64 изображений).

Написано более года назад
mayton2019 @mayton2019

Tensor - это матрица чисел?

Написано более года назад
Семен @GSimonX37 Автор вопроса

mayton2019, Да.

Написано более года назад
mayton2019 @mayton2019

Семен, а ты можешь написать тест который подаст на вход 2 матрицы (простые 3х2) и
как-бы подтвердить что все окей и мы получили то что ожидаем.

Написано более года назад

Семен @GSimonX37 Автор вопроса

mayton2019, да, конечно:

def loss(true: Tensor,
         predict: Tensor) -> Tensor:
    
    categorical = CategoricalCrossentropy(
        reduction=None
    )

    loss = tf.reduce_mean(categorical(
        y_true=true,
        y_pred=predict
    ))

    return loss

y_true = tf.constant([[0, 1, 0], [0, 0, 1]])
y_pred = tf.constant([[0.05, 0.95, 0], [0.1, 0.8, 0.1]])

loss(
    true=y_true,
    predict=y_pred
)

# <tf.Tensor: shape=(), dtype=float32, numpy=1.1769392>

Все работает корректно, я сравнил с примером из : документации.

Написано более года назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 91 просмотр
1

ответ
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 08 авг.
- 85 просмотров
1

ответ
Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 171 просмотр
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 297 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 44 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 67 просмотров
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 63 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 232 просмотра
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 174 просмотра
2

ответа
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Стажер Моушен дизайнер для контента в соцсетях музыкального стартапа

Vocaberry

от 15 000 до 15 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

А что здесь происходит? Можешь обычным человеческим языком рассказать?

def loss(true: Tensor, predict: Tensor) -> Tensor: .....
mayton2019, я вычисляю функцию потерь.

Вызываю ее на каждом шаге (батче) для каждого выхода:

rating_loss = loss(rating_batch, rating_predict) genres_loss = loss(genres_batch, genres_predict)
mayton2019, возможно я неправильно считаю среднее значение (так как передается батч из 64 изображений).
Семен, а ты можешь написать тест который подаст на вход 2 матрицы (простые 3х2) и
как-бы подтвердить что все окей и мы получили то что ожидаем.
mayton2019, да, конечно:

def loss(true: Tensor, predict: Tensor) -> Tensor: categorical = CategoricalCrossentropy( reduction=None ) loss = tf.reduce_mean(categorical( y_true=true, y_pred=predict )) return loss y_true = tf.constant([[0, 1, 0], [0, 0, 1]]) y_pred = tf.constant([[0.05, 0.95, 0], [0.1, 0.8, 0.1]]) loss( true=y_true, predict=y_pred ) # <tf.Tensor: shape=(), dtype=float32, numpy=1.1769392>

Все работает корректно, я сравнил с примером из : документации.

Как в tensorflow построить модель с несколькими выходами?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт