Библиотека для работы с изображениями в C++?

Question

Progrik @Progrik

Библиотека для работы с изображениями в C++?

Я решил попробовать написать программу для распознавания изображений (для курсовика), а если быть точнее — цифр (база MNIST). Почитал что пишут разные люди по этой теме и решил, что чем выбирать абы как и что — надо подобрать хорошую либу, чтобы потом не переписывать 10 раз код и не проклинать себя в плохом выборе.

В какой IDE писать пока тоже не решил — на выбор у меня Borland C++ Builder 6 или MS Visual Studio 2008 Pro || 2010 Express.

Хочется услышать ответ на вопрос какую библиотеку/класс выбрать исходя из следующего:

1. Простая установка в описанные IDE или сложная, но хорошо (читай: пошагово) разобранная где-нибудь на офф сайте.

2. Быстрота работы с изображениями

3. Желательно русская документация, можно такой вариант: русская чуток устаревшая (книга, например, или просто сайт) и очень свежая английская

4. Хорошая документация, не просто пару строк о каждой функции, но и описание аргументов, возвращаемых параметров и

5. Обязательно примеры, examples, примеры.

P.S.: если вы где-нибудь видели сравнение либ для работы с изображениями, то поделитесь, пожалуйста. Я выгуглил только пару старых статей, да и ещё там до кучи субъективизма.

Вопрос задан более трёх лет назад
18113 просмотров

Комментировать

Подписаться 9 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Разработчик на C++

12 месяцев

Далее
Академия Эдюсон

Разработчик игр на Unreal Engine + ИИ

9 месяцев

Далее
Stepik

Профессия: Разработчик C++ (Junior)

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 4

1 комментарий

5 комментариев

Progrik @Progrik Автор вопроса

Во-первых, я же написал «распознавания изображений, а если быть точнее — цифр».
Во-вторых, смысл курсовика не в описании какого-то продукта «распознавалки» вроде ABBY Fine Reader, а написание и объяснение какого-либо алгоритма. Библиотека для работы с изображениями — это только «фундамент».

Написано более трёх лет назад
Алексей @alman

Я ж говорю, используйте монохромный BMP для хранения распознаваемых цифр: en.wikipedia.org/wiki/BMP_file_format

Какие Вам требования к разыскиваемой библиотеке? Имхо, getpixelcolor(x,y) и, возможно, getregion(x,y,dx,dy), будет достаточным. Делов-то — распарсить DIB заголовок и написать несколько функций для доступа к Image Data PixelArray — дел на полтора часа. Вы больше будете ждать ответов на свой вопрос, потом потратите столько же время на выбор и изучение библиотеки.

Написано более трёх лет назад
Progrik @Progrik Автор вопроса

Спасибо за совет, но я думаю, что если я буду работать через стандартные библиотеки в борланде или вижуале, то скорее всего я могу потерять какое-то приличное количество времени на обработку изображений. К тому же, я предполагаю, что к некоторым входным данным придётся применять различные фильтры, которые вряд ли реализованы в стандартных либах у компиляторов.

Написано более трёх лет назад
bigbaraboom @bigbaraboom

Я думаю вы будите использовать только три фильтра — Resize, Scaling и Rotate. И будите ими манипулировать не с самим изображением, а с его частями.

Написано более трёх лет назад
Progrik @Progrik Автор вопроса

Возможно, да, но пока у меня нет целостного представления о дальнейшем использовании того, что я напишу (авось и диплом по этому буду делать через 3 года), поэтому хочется исходить от максимальных возможностей, а уже потом что-то урезать за не надобностью, если возникнет таковое желание. Просто я уже пописал велосипедов в других программах, сейчас хочется избежать таких вещей, дабы сэкономить время.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

Простой
Возможно ли сделать скрин действующего окна через Alt + PrtSc на С++?
- 1 подписчик
- 08 июл.
- 114 просмотров
1

ответ
C++

Простой
Как можно через ООП сериализировать в разные форматы в едином стиле?
- 1 подписчик
- 07 июл.
- 64 просмотра
1

ответ
C++

+1 ещё

Простой
Почему компилятор подчёркивает импортируемый класс как ошибку «индификатор не определён»?
- 1 подписчик
- 04 июл.
- 103 просмотра
1

ответ
Обработка изображений

+1 ещё

Простой
Через какой ИИ можно массово редактировать изображения?
- 2 подписчика
- 30 июн.
- 387 просмотров
3

ответа
C++

Сложный
Концепт проверки совместимости с шаблонным конструктором?
- 1 подписчик
- 25 июн.
- 95 просмотров
1

ответ
C++

Простой
Я единственный у кого cppreference.com через раз падает с ERR_TIMED_OUT?
- 1 подписчик
- 21 июн.
- 177 просмотров
2

ответа
C++

+1 ещё

Простой
Как правильно посчитать UV координаты из локальных нормальных?
- 1 подписчик
- 20 июн.
- 107 просмотров
1

ответ
C++

+3 ещё

Простой
Почему бинарник скомпилированный через CMake весит больше, чем напрямую скомпилированный через clang++?
- 1 подписчик
- 11 июн.
- 325 просмотров
1

ответ
C++

+2 ещё

Простой
Как настроить clangd на видимость всех файлов, чтобы не указывать относительные пути в include?
- 1 подписчик
- 10 июн.
- 103 просмотра
1

ответ
Программирование

+4 ещё

Простой
Выбор между изучением c++ и Golang, что изучать?
- 3 подписчика
- 09 июн.
- 1350 просмотров
10

ответов
Показать ещё Загружается…

Answer 1 · 2011-02-14 19:34:01

Честно говоря не очень понял, вам нужна библиотека для работы с графикой или библиотека уже которая заточена под нейронные сети?

Что касается графики, то определённо ImageMagick.

Что касается вашего курсовика, то вот вам в помощь старая статья, но очень понятная.

Нейронные сети, распознавание изображений (Журнал программист №10 за 2001 год)

Answer 2 · 2011-02-14 23:25:59

OpenCV — первое, на что нужно обратить внимание, много хороших примеров в самой библиотеке, должно хватить практически для всего

Answer 3 · 2011-02-14 20:08:53

Ну тогда ImageMagick, быстрый, надежный и постоянно развивающийся повсеместно используемый на крупных проектах.

Answer 4 · 2011-02-14 20:16:49

Ничего не скажу о библиотеке, но расскажу одну историю. Мой хороший друг подрабатывал тем, что писал программы для дипломов и курсовиков. Одна девушка обратилась к нему с аналогичной проблемой — ей задали написать программу распознавания текстов.

Первое, что он сделал — разбил текст на строки, анализируя плотность точек в каждой строке пикселов.

Вторым шагом было была разбивка строк на знаки, причём, он учёл, что в современных шрифтах ширина разных символов может быть разной.

Наконец, найденные знаки он показывал пользователю и предлагал ввести с клавиатуры букву или знак, соответствующий изображению. Таким образом программа обучалась.

Результат был удивительный — после обучения программа показывала лучшие результаты, чем любые существующие на тот момент системы распознавания текста (1995 год).

Программа имела два недостатка — жесткая привязка к шрифту(ам), на котором(ых) производилось обучение. Чем больше шрифтов понимала программа, тем меньше была точность распознавания.

С тех пор прошло много лет. Жаль, что друг больше никогда не возвращался к этой теме. Его простая программа даже сейчас имела бы смысл для распознавания большого большого текста, напечатанного одним шрифтом, например книг.

Кстати, тоже не понимаю, зачем автору вопроса нужна библиотека для работы с изображениями — используйте монохромный BMP на входе «распознавалки». Смысл курсовика ведь не в работе с графическими библиотеками, а именно в распознавании текста.

Библиотека для работы с изображениями в C++?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт