Как преобразовать отсканированные документа в редактируемые текст
Есть некоторые случаи в вашей работе, вам необходимо изменить или редактировать "уже печатном виде", отсканированные в tif или pdf файлов, или просто файл не более softcopy редактировать существующие.
Отсканированных документов в виде изображения и больше не редактируются с помощью программного обеспечения для обработки текста, как Microsoft Word.
Решение, собственно, уже не новые и это может быть только знания, но и для достижения целей.
Процесс извлечения текста из изображения, называется оптического распознавания символов (OCR). Много программного обеспечения с этого потенциала, как ABBYY FineReader OCR, Adobe Acrobat, GOCR, и OmniPage уже доступны в интернете, некоторые из них бесплатны, и большинство из них за плату.
Если у вас есть Microsoft Office 2003 или 2007 установлены в вашем компьютере, Вы можете эффективно выполнять работу, выполнив эту простую инструкцию;
1. В меню "Пуск" пункт "Все программы, указывают на Microsoft Office, указывают на Microsoft Office Tools, а затем нажмите кнопку Microsoft Office Document Imaging.
2. В Document Imaging, нажмите кнопку "Открыть" в меню "Файл".
3. Найдите файл, который вы хотите открыть, а затем нажмите кнопку Открыть.
4. Вы можете запустить OCR по активного документа, нажав Признать текст с помощью оптического распознавания символов на стандартной панели инструментов.
Если ваш документ сканируется в jpeg, БМП или иной формат файла, преобразовать его первым. Tif с использованием MS краской.
После преобразования, выберите все и копировать текст в отдельное слово документа для редактирования. Пожалуйста, обратите внимание, что некоторые изображения текста не может быть надлежащим образом признаны OCR инструмент, а не быть корректно преобразовано в текст, таким образом, двойная проверка не требуется.
Подала в: программного обеспечения и прикладных
Местные дата: июнь, 2008












