News

 

Oktober 2012 - OCR Erweiterungen

Ab Version 5.4.14 gibt es im JWP DMS erweiterte Möglichkeiten im Bereich der OCR Bearbeitung von Dokumenten

 

Folgende Erweiterungen wurden in der neuen Version von JET Workplace ergänzt:

 

Aufzählung Kombination mehrerer Detailergebnisse zu einem Beschlagwortungsergebniswert

Ab sofort können sowohl fixe (konstante) Werte, Textelemente aus dem OCR Umfang, sowie zusätzliche Daten aus dem Datenbestand beliebig miteinander kombiniert und zu einem Ergebnis zusammengefasst werden.

Beispiele:

Kombination eines fixen Wertes mit einem Text aus der OCR-Erkennung Ermittlung eines, zum Text in der OCR Erkennung existierenden Datenbankwertes
<IndexFieldID>d4fe6461-b776-11d3-8779-0008c75c32b9</IndexFieldID>
     <Value>
      <ConstValue>11OD</ConstValue>
      <RegexObject>
       <RegexPattern>Auftrags. - Nr.\s*([0-9]+)[^0-9]*?</RegexPattern>
       <GroupNr>1</GroupNr>
      </RegexObject>
     </Value>
    </Field>
 

<IndexFieldID>2743c493-10b6-47e6-ac75-98c0bb7f34b2</IndexFieldID>
     <Value>
       <ConstValue>Name: </ConstValue>
     </Value>
     <SQLValue>
      <ConstValue>Select Name as value from Party Where PartyNr = '</ConstValue>
      <RegexObject>
       <RegexPattern>Kundennummer:[\s]*([0-9]*)</RegexPattern>
       <GroupNr>1</GroupNr>
      </RegexObject>
      <ConstValue>'</ConstValue>
     </SQLValue>
    </Field>
 

 

Aufzählung Erweiterung der OCR Ergebnisse mit ad hoc Abfragen in den JET Workplace Datenbestand

Mit den Ergenissen aus der OCR Erkennung können zusätzliche Beschlagwortungen durch Abfragen in den Datenbestand von JET Workplace die Beschlagwortung des betreffenden Dokuments synamisch erweitern. Eine nachträgliche (über Trigger, Wartungspläne, usw.) Bearbeitung der Daten kann somit entfallen und sofort zum Zeitpunkt der Dokumentanlage erfolgen.

 

Aufzählung Neue Auslesemethode (Stichwort: Tokenizer) für das Lesen der Dokumentinhalte

Bestimmte spezielle (propriätere) Schriftarten haben in der Vergangenheit Probleme im Zuge der OCR Texterkennung verursacht. DIese Probleme wurden durch Einführung einer neuen OCR-Methode erheblich bereinigt und liefern bei vielen der problembehafteten Dokumentinhalte brauchbare Ergebnisse. Die Steuerung dieser "zusätzlichen" Methode erfolgt einerseits im Optionendialog des Dokumentexplorers ("Extras" --> "Optionen" --> "OCR Optionen") für die manuelle Übernahme von Dokumenten, sowie im Bereich \ServiceConfiguration\DocumentImport\DirectoryXX\OCR\ in den JET Settings für den automatischen Dokumentimport.

 
© 2018 - IT Information Competence Corner | Ferdinand-Porsche-Straße 1, 4470 Enns | office@informationcc.at