@maryaTurova

Keras: 50000 классов, реально?

Имеется база картинок с 50 тыс. словами и с разными шрифтами.Распознать через OCR не реально, по крайней мере стандартными способами.
Ранее ,при использовании обучений картинок, количество классов не превышало 200 (т.к. и набор картинок состоял из не более 200 слов).Т.е. я генерирую картинки со словами с разными шрифтами,шумами и т.д. 1 слово=1 папка картинок.
Но сейчас задача состоит в обучении 50 тыс. Верно я понимаю что и столько же классов для обучения? Или я что то не так понимаю. Гуру подскажите.
  • Вопрос задан
  • 117 просмотров
Пригласить эксперта
Ответы на вопрос 1
слова – словарные или рандомные наборы символов?
Обычно распознают по буквам, объединяя результат в последовательность. Распознавание текста – не задача классификации по N классам.
Я бы вообще порекомендовал не париться, а попробовать готовый Google Cloud Vision API – первые 1000 распознаваний бесплатны, достаточно, чтобы попробовать-убедиться в работоспособности.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы