Список вопросов
Как зайти в Даркнет?!
25th January, 01:11
5
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
893
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
912
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
905
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4381
0
Помогите пожалуйста решить задачи
24th November, 23:53
6086
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4350
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4395
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Библиотека для работы с изображениями в C++?
Просмотров: 402
 
Ответов: 4
Я решил попробовать написать программу для распознавания изображений (для курсовика), а если быть точнее — цифр (база MNIST). Почитал что пишут разные люди по этой теме и решил, что чем выбирать абы как и что — надо подобрать хорошую либу, чтобы потом не переписывать 10 раз код и не проклинать себя в плохом выборе.
В какой IDE писать пока тоже не решил — на выбор у меня Borland C++ Builder 6 или MS Visual Studio 2008 Pro || 2010 Express.
Хочется услышать ответ на вопрос какую библиотеку/класс выбрать исходя из следующего:
1. Простая установка в описанные IDE или сложная, но хорошо (читай: пошагово) разобранная где-нибудь на офф сайте.
2. Быстрота работы с изображениями
3. Желательно русская документация, можно такой вариант: русская чуток устаревшая (книга, например, или просто сайт) и очень свежая английская
4. Хорошая документация, не просто пару строк о каждой функции, но и описание аргументов, возвращаемых параметров и
5. Обязательно примеры, examples, примеры.
P.S.: если вы где-нибудь видели сравнение либ для работы с изображениями, то поделитесь, пожалуйста. Я выгуглил только пару старых статей, да и ещё там до кучи субъективизма.
Честно говоря не очень понял, вам нужна библиотека для работы с графикой или библиотека уже которая заточена под нейронные сети?
Что касается графики, то определённо ImageMagick.
Что касается вашего курсовика, то вот вам в помощь старая статья, но очень понятная.
Нейронные сети, распознавание изображений (Журнал программист №10 за 2001 год)
Ничего не скажу о библиотеке, но расскажу одну историю. Мой хороший друг подрабатывал тем, что писал программы для дипломов и курсовиков. Одна девушка обратилась к нему с аналогичной проблемой — ей задали написать программу распознавания текстов.
Первое, что он сделал — разбил текст на строки, анализируя плотность точек в каждой строке пикселов.
Вторым шагом было была разбивка строк на знаки, причём, он учёл, что в современных шрифтах ширина разных символов может быть разной.
Наконец, найденные знаки он показывал пользователю и предлагал ввести с клавиатуры букву или знак, соответствующий изображению. Таким образом программа обучалась.
Результат был удивительный — после обучения программа показывала лучшие результаты, чем любые существующие на тот момент системы распознавания текста (1995 год).
Программа имела два недостатка — жесткая привязка к шрифту(ам), на котором(ых) производилось обучение. Чем больше шрифтов понимала программа, тем меньше была точность распознавания.
С тех пор прошло много лет. Жаль, что друг больше никогда не возвращался к этой теме. Его простая программа даже сейчас имела бы смысл для распознавания большого большого текста, напечатанного одним шрифтом, например книг.
Кстати, тоже не понимаю, зачем автору вопроса нужна библиотека для работы с изображениями — используйте монохромный BMP на входе «распознавалки». Смысл курсовика ведь не в работе с графическими библиотеками, а именно в распознавании текста.
Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться