Сведения о вопросе

Solllo

16:03, 1st July, 2020

Размещение текста в изображении

Просмотров: 463   Ответов: 4

В настоящее время я работаю над проектом, и моя цель-найти текст в изображении. OCR ' в мои намерения пока не входит перевод текста. Я хочу в основном получить границы текста в изображении. Я использую компонент AForge.Net imaging для манипуляций. Любая помощь в каком-то смысле или другой?

Обновление 2/5/09: С тех пор я пошел по другому маршруту в своем проекте. Однако я попытался получить текст с помощью MODI (Microsoft Office Document Imaging). Это позволяет вам OCR изображение и тянуть текст из него с некоторой легкостью.



  Сведения об ответе

nYU

18:03, 1st July, 2020

Это активная область исследований. Существует буквально уйма научных работ на эту тему. Это будет трудно, чтобы дать вам помощь, особенно без более deatails. Вы ищете конкретные типы текста? Шрифты? Только по-английски? Вы знакомы с академической литературой?

"Text detection"-это стандартная проблема в любой системе OCR (оптического распознавания символов), и, следовательно, существует множество битов кода в паутине, которые имеют дело с ней.

Я мог бы начать перечислять груды ссылок из google, но я предлагаю вам просто сделать поиск по "text detection" и начать читать :). Существует также достаточно примеров кода, доступных.


  Сведения об ответе

P_S_S

18:03, 1st July, 2020

распознавание текста внутри изображения действительно является горячей темой для исследователей в этой области, но только начало выходить из-под контроля, когда captcha's стал "norm" с точки зрения защиты от спам-ботов. Зачем использовать капчу в качестве защиты? ну потому что это/было очень трудно найти (и прочитать) текст внутри изображения!

Причина, по которой я упоминаю captcha's, заключается в том, что большинство advancement* сделано в этой крошечной области, и я думаю, что ваше решение лучше всего найти там. особенно потому, что капча-это действительно поиск текста (или чего-то похожего на текст) внутри загроможденного изображения, а затем попытка правильно прочитать буквы.

так что если вы можете найти себе хороший инструмент для взлома капчи с открытым исходным кодом, у вас, вероятно, есть все, что вам нужно, чтобы продолжить свои поиски...
Вы, вероятно, даже можете выбросить самый сложный код, который обрабатывает само распознавание символов, потому что эти OCR используются для чтения искаженного текста, что вам не нужно делать.

* : продвижение с точки зрения видимой, полезной и практической информации для "non-researcher"


  Сведения об ответе

darknet

18:03, 1st July, 2020

Если вы согласны с использованием онлайн-API для этого, то API at http://www.wisetrend.com/wisetrend_ocr_cloud.shtml может выполнять обнаружение текста в дополнение к просто OCR.


  Сведения об ответе

ITSME

18:03, 1st July, 2020

Преобразование ширины штриха может сделать это за вас. Это, по крайней мере, то, что MS разработал для своего мобильного телефона OS. Обсуждение реализации находится здесь по адресу https://stackoverflow.com/


Ответить на вопрос

Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться