Возможно ли выполнить распознавание текста в Linux?

Question

Возможно ли выполнить распознавание текста в Linux?

Мне нужен сервер на базе Linux, который можно настроить для получения изображений и их преобразования в текст, который будет вставлен в базу данных. Возможно ли это, особенно через API, чтобы организация могла взаимодействовать со службой в случае необходимости?

1

ocr

Источник

crazybyte 28 фев '10 в 19:52

4 ответа

Решение

Вы смотрели на WatchOCR? Это бесплатный OCR-сервер с открытым исходным кодом, который преобразует PDF-файлы только с изображениями в текстовые PDF-файлы с возможностью поиска из просматриваемой папки или общего сетевого ресурса.

0

Источник

rlangner 02 июл '10 в 21:14

У меня был проект, который требовал OCR. Вы можете использовать GOCR для распознавания текста. Для преобразования в формат изображения pbm вы можете использовать djpeg. Если вам нужно интегрироваться с веб-интерфейсом, вы можете вызвать команду преобразования /ocr из PHP, а также отсюда, чтобы реализовать сохранение БД.

0

Источник

mxg 28 фев '10 в 20:11

Я бы настроил очередь сообщений и отправил ей задачи для обработки. Все, что вам действительно нужно сделать, это загрузить файл в виде изображения на общую платформу хранения, возможно, GlusterFS или аналогичную, а затем вставить имя файла и путь в очередь сообщений для обработки. Все, что вам нужно сделать, - это настроить процесс для прослушивания очереди и запустить gocr, передавая выходные данные в вашу базу данных.

Легко.. В теории.;)

0

Источник

Tom O'Connor 28 фев '10 в 21:50

Другие вопросы по тегам ocr

Ronald Pottol 28 фев '10 в 21:41 2010-02-28 21:41 · Accepted Answer · 2010-02-28 21:41

Тезеракт кажется лучшим. http://code.google.com/p/tesseract-ocr/

Отзывы, кажется, говорят, что это единственный, который бьет перепечатывание вещей. http://www.linux.com/archive/feature/138511 http://www.linux.com/archive/feed/57222

Разве люди не гуглили какие-либо деньги? 5 минут чтения того, что я нашел, используя "linux ocr" в качестве условий поиска.