Как исправить переобучение сверточной нейронной сети(keras)?

Question

Дима Zero @zero35657469845465

Машинное обучение

Как исправить переобучение сверточной нейронной сети(keras)?

Начал изучать машинное обучение и уже подошёл к практике
Решил сделать нейросеть, которая разпознает числа на циферблате калькулятора
Но результат плохой
Я три дня пытался настроить её, искал материал, который мог бы помочь, или примеры, но сеть постоянно переобучается
Минимальное значение, которое я нашёл при разхождении между обучающей выборкой и тестовой, это примерно ±1.3
Мне кажется, что я что-то принципиально делаю не так, но не хватает опыта, чтобы понять, что именно
Поэтому хочу понять, есть ли явные ошибки при проектировании сети

Мои действия:

Подготовка данных:
1) Скачал примерно 150 изображений калькуляторов
2) Обрезал циферблаты
3) С помощью библиотеки Pillow привёл их к размеру 300x100 пикселей (растягивание/сжатие)
4) Составил матрицу пикселей для каждого изображения размером 300x100x3 (где 3 - это цветовые каналы RGB)
5) Загрузил всё это в базу данных PostgreSQL и добавил для каждого изображения правильный ответ в нужном формате

Формат вывода, аналогичный учебному примеру, я выбрал softmax
Однако, поскольку у меня много чисел и могут быть десятичные дроби, я использую следующий формат
На выходе я получаю матрицу размером (11, 10), где столбец 0 это позиция точки, а столбцы с 1 по 10 это числа от 0 до 9.
Используя функцию np.argmax, я определяю номер строки, соответствующей распознанному числу

Пример для числа 2.2

[
[0, 1, 0, 0, 0, 0, 0, 0, 0, 0] - точка на 1-й позиции с конца
[1, 0, 0, 0, 0, 0, 0, 0, 0, 0] - 10-е число 0
[1, 0, 0, 0, 0, 0, 0, 0, 0, 0] - 9-е число 0
[1, 0, 0, 0, 0, 0, 0, 0, 0, 0] - 8-е число 0
[1, 0, 0, 0, 0, 0, 0, 0, 0, 0] - 7-е число 0
[1, 0, 0, 0, 0, 0, 0, 0, 0, 0] - 6-е число 0
[1, 0, 0, 0, 0, 0, 0, 0, 0, 0] - 5-е число 0
[1, 0, 0, 0, 0, 0, 0, 0, 0, 0] - 4-е число 0
[1, 0, 0, 0, 0, 0, 0, 0, 0, 0] - 3-е число 0
[0, 0, 1, 0, 0, 0, 0, 0, 0, 0] - 2-е число 2
[0, 0, 1, 0, 0, 0, 0, 0, 0, 0] - 1-е число 2
]

Код нейронной сети

model = keras.Sequential(
            [
                Conv2D(filters=5, kernel_size=5, activation='relu', input_shape=(300, 100, 3)),
                Conv2D(filters=5, kernel_size=5, activation='relu'),
                MaxPooling2D(pool_size=2),


                Conv2D(filters=5, kernel_size=5, activation='relu'),
                Conv2D(filters=5, kernel_size=5, activation='relu'),
                Conv2D(filters=5, kernel_size=5, activation='relu'),
                MaxPooling2D(pool_size=2),

                Conv2D(filters=5, kernel_size=5, activation='relu'),
                Conv2D(filters=5, kernel_size=5, activation='relu'),
                Conv2D(filters=5, kernel_size=5, activation='relu'),
                MaxPooling2D(pool_size=2),


                Flatten(),
                Dense(units=60, activation="relu"),
                Dense(units=60, activation="relu"),

                Dense(units=110),
                Reshape((11, 10)),
                Activation('softmax')
            ]
        )

        model.compile(
            optimizer=keras.optimizers.Adam(learning_rate=0.0001),
            loss="categorical_crossentropy",
            metrics=["accuracy"],
        )

        his = model.fit(
            trainings_input,
            trainings_exit,
            batch_size=32,
            epochs=200,
            validation_split=0.2,
        )

        model.evaluate(trainings_input, trainings_exit)

Сеть, кажется, что-то распознает
Например, количество цифр и позицию точки она распознает в целом верно (тестировалась на наборе валидации, который не участвовал в обучении)
Однако ни разу не распознала цифру верно
Очень редко она была максимально близка, но мне кажется, что это случайность
Вот график расхождения для 200 эпох.

plt.plot(his.history['loss'])
plt.plot(his.history['val_loss'])
plt.savefig('training_validation_correlation.png')

Вопрос задан более года назад
94 просмотра

4 комментария

Подписаться 1 Средний 4 комментария

kamenyuga @kamenyuga

150 изображений для обучения нейронки? Маловато будет. Вот и результат никакой. Классический для изучения нейронок набор данных MNIST содержит 60к картинок. На практике данных нужно как можно больше - миллионы и миллиарды, сколько бюджет и ресурсы позволяют, к тому же их дополнительно искажают по-всякому на каждой эпохе случайным образом.

Написано более года назад
Дима Zero @zero35657469845465 Автор вопроса

kamenyuga, скорее всего вы правы сократил обучающую выборку на треть и результать стал гораздо хуже

Написано более года назад
Дима Zero @zero35657469845465 Автор вопроса

kamenyuga, а что вы имеете ввиду под искажением на каждой эпохе?

Написано более года назад
kamenyuga @kamenyuga

Дима Zero, эта тема называется data augmentation (обычно речь именно про изображения) и присутствует во всех нормальных учебниках и туториалах про машинное обучение и нейронки для работы с картинками.

Написано более года назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 299 просмотров
3

ответа
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 136 просмотров
3

ответа
Python

+3 ещё

Простой
Как повысить точность классификации по табличным документам?
- 2 подписчика
- 19 мая
- 284 просмотра
1

ответ
Машинное обучение

+2 ещё

Средний
Какие виды эмбединга используется в nlp?
- 1 подписчик
- 10 мая
- 93 просмотра
1

ответ
Машинное обучение

Средний
В чем преимущество позиционного кодирования синусами?
- 1 подписчик
- 25 апр.
- 109 просмотров
1

ответ
Машинное обучение

Простой
Как обучается трансформер?
- 1 подписчик
- 25 апр.
- 92 просмотра
1

ответ
Python

+2 ещё

Средний
GeForce GTX 1650 > RTX A2000 — как такое возможно?
- 2 подписчика
- 15 апр.
- 754 просмотра
2

ответа
Машинное обучение

+2 ещё

Средний
Какие архитектуры с механизмом внимания появились после transformer?
- 2 подписчика
- 11 апр.
- 174 просмотра
1

ответ
Python

+4 ещё

Средний
Как реализовать фарм-бота для игры Rush Royale?
- 1 подписчик
- 01 апр.
- 772 просмотра
2

ответа
Показать ещё Загружается…

React-разработчик (frontend) с опытом работы в области ML

DevTeam.Space

от 2 000 до 3 000 $

ML Engineer / Data Scientist (Middle+, 25h/w)

Perare

от 2 100 до 2 600 $

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

150 изображений для обучения нейронки? Маловато будет. Вот и результат никакой. Классический для изучения нейронок набор данных MNIST содержит 60к картинок. На практике данных нужно как можно больше - миллионы и миллиарды, сколько бюджет и ресурсы позволяют, к тому же их дополнительно искажают по-всякому на каждой эпохе случайным образом.
kamenyuga, скорее всего вы правы сократил обучающую выборку на треть и результать стал гораздо хуже
kamenyuga, а что вы имеете ввиду под искажением на каждой эпохе?
Дима Zero, эта тема называется data augmentation (обычно речь именно про изображения) и присутствует во всех нормальных учебниках и туториалах про машинное обучение и нейронки для работы с картинками.

Как исправить переобучение сверточной нейронной сети(keras)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт