OCR

Mit dem Dienst "OCR"

 

icon ocr

 

stellt das Portal die Funktion zur OCR-Text Erkennung von Grafiken zur Verfügung.

 

Der Dienst zur optischen Texterkennung (OCR) basiert auf dem Webservice "OCR".

 

Text erkennen

 

Mit diesem Dienst können Sie auf grafische Dateiformate oder PDF-Dokumente eine optische Texterkennung (OCR) anwenden und diese in den Ausgabeformaten PDF, Text und XML ablegen. Durch die Verwendung von OCR können Sie Grafiken in durchsuchbare PDF-Dokumente umwandeln.

 

Eine Anwendungsmöglichkeit ist z.B. die Umwandlung von gescannter Eingangspost, um diese auf bestimmte Begriffe zu durchsuchen und dadurch das Dokument automatisch im Workflow einem Folgeprozess zuordnen zu können.

 

hint

Um eine optimale Erkennung zu erhalten, muss das Eingangsformat (TIFF, PNG, PDF oder JPEG) eine Mindestauflösung von 200 DPI aufweisen.

 

Nach der Festlegung des gewünschten Ausgabeformats "PDF", "Text" oder "XML" und der Sprache in der das Ausgangsdokument verfasst wurde, können Sie die Texterkennung der Grafikdatei starten.

 

dialog ocr

 

hint

Die Festlegung der Ausgangssprache ist wichtig, da nur so die Sonderzeichen einer Sprache, z.B. "ö", "ü" oder "ä" bei Deutsch, erkannt werden können. Ohne diese Festlegung werden diese Sonderzeichen oft falsch interpretiert.