Как обучать нейронную сеть по одной картинке за раз?

Question

yavaskript @yavaskript

Как обучать нейронную сеть по одной картинке за раз?

Недавно начал изучать Tensorflow ради интереса. Во всех примерах, которые я встречал, сетке скармливают целый датасет из 40к+ изображений для тренировки. Далее тестируют. Но мне стало интересно вот что. Допустим, я хочу научить сетку определять символы, для которых нет огромного датасета (я придумал собственные иероглифы). И собираюсь делать это так: в специальном окошке рисую свой символ, и говорю сетке, какой именно это символ. И так сотни тысяч раз, по одной картинке за раз.
Так как я еще не очень понимаю всю эту систему с нейронными сетями и Tensorflow, хотелось бы узнать следующее:
1) получится ли обучать нейронную сеть, скармливая ей по одной картинке, а не целый датасет? И как это примерно реализовать?
2) как именно скармливать сетке 1 картинку? Формировать датасет из 1 картинки?

Вопрос задан более трёх лет назад
767 просмотров

1 комментарий

Подписаться 6 Простой 1 комментарий

Пригласить эксперта

Ответы на вопрос 5

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

Простой
Как создать offline карту на python?
- 1 подписчик
- 7 часов назад
- 71 просмотр
2

ответа
Python

Простой
Какие модули есть в Python для целей анализа, форматирования, вывода текста?
- 2 подписчика
- 8 часов назад
- 43 просмотра
2

ответа
Python

+1 ещё

Простой
Отправка post на сервер Telegram, не правильный формат?
- 2 подписчика
- 17 часов назад
- 189 просмотров
1

ответ
Python

+1 ещё

Простой
Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?
- 1 подписчик
- вчера
- 115 просмотров
2

ответа
Python

+1 ещё

Простой
Почему не срабатывает клик по элементу при открытии станицы selenium python?
- 1 подписчик
- вчера
- 43 просмотра
1

ответ
Python

Простой
Выполнение парсинга странцы?
- 2 подписчика
- вчера
- 111 просмотров
3

ответа
Нейронные сети

+1 ещё

Средний
Существует ли аналог GPTs?
- 3 подписчика
- вчера
- 966 просмотров
3

ответа
Python

Простой
Как исправить ошибку?
- 1 подписчик
- 16 апр.
- 101 просмотр
1

ответ
Нейронные сети

+1 ещё

Простой
Какие сейчас текстовые нейросети можно локально поставить?
- 1 подписчик
- 16 апр.
- 59 просмотров
1

ответ
Python

Простой
Что не так с кодом Python?
- 1 подписчик
- 15 апр.
- 171 просмотр
1

ответ
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Подключить ChatGPTs к amoCRM, обучить, написать алгоритм поиска

18 апр. 2024, в 10:19

5000 руб./за проект

Разработка админ панели для сайта

18 апр. 2024, в 10:07

10000 руб./за проект

Настройка сервера

18 апр. 2024, в 10:03

2000 руб./за проект

В чём проблема нарисовать 10 символов, а потом уже отдать сетке?

Answer 1 · 2019-10-08 15:10:08

Обучение и происходит по одной картинке.
То есть если размер партии = 1 картинка, то после просмотра 1 картинки полученные ошибки сразу запускают в backprop, чтобы изменить весы сети.
Если размер партии 10, то картинки просматриваются, но ошибка суммируется отдельно, и отдается в backprop только в конце. То есть твоя сеть смотрит 10 картинок не обучаясь, но потом суммарная ошибка применяется.
Главная причина, почему второй вариант применяется чаще - потому что рассчитывать backprop на сотне миллионов весов это затратная операция и при batch=10 ты сокращаешь время в 10 раз. При этом кол-во выученой инфы сокращается незначительно.

Answer 2 · 2019-10-08 17:37:11

При такой постановке вопроса, уже понятно, что ничего хорошего не получится. Хотя, формально ответы такие:
1) да
2) да
Но, повторю, так делать НЕ надо (сеть либо переобучится, либо не будет никакой сходимости функции потерь, в обоих случаях сеть превратится в бесполезный генератор псевдослучайных чисел). А что тогда делать? Хорошо бы точно определиться с задачей. Насколько я понял, речь о самой простой классификации (у нас есть M классов (твоих иероглифов) и каждая картинка принадлежит только одному из них). Это так называемая multi-label classification. Если так, то обучать лучше минибатчами (это набор из нескольких картинок). Минибатчи формируются путём случайного отбора примеров из обучающей выборки. Тонкостей и здесь довольно много. Например, минибатчи лучше делать несмещёнными (т.е. отбирать примеры так, чтобы метки всех классов были представлены в минибатче в одинаковом количестве). Если обучающих данных мало (1 пример на один класс это конечно вообще не для нейронных сетей задача, но тем не менее...), то данные дополняют искусственно. Можно случайный шум к картинке добавлять, поворачивать её немного, масштабировать, смещать параллельным переносом, цвет менять и ещё разные искусственные преобразования делать (см. https://github.com/albu/albumentations ).

Answer 3 · 2019-10-08 18:33:23

grinat @grinat

Сиамские нейросети. Там по моему как раз таки все примеры на иероглифах.

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2019-10-08 19:29:12

1) Да, но это будет медленнее. См. ответ на п.2
2) Точно так же, как и батч из N картинок, но для случая N=1. Грубо говоря, массив [img] из 1 картинки. Допустим, картинка img - это np.array размера (Y, X, D). Тогда сети надо подать img[np.newaxis, ...], что даст np.array размера (1, Y, X, D).

Answer 5 · 2019-10-09 19:24:50

Можно насоздавать изображения из одного растр-объекта (символа) динамически:
1.Вращение в 3D
2. Деформация в 3D.
3. Фильтры ("шум", размытие, пиксиализация и т.п.)
X. Комбинации всех предыдущих пунктов.
НО! обязательно с сохранением топологии объекта.

Как обучать нейронную сеть по одной картинке за раз?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт