IntelligentDocumentAutomationPreParser
Gruppe |
|
Funktion |
Dieser Preparser dient dazu Informationen aus einem PDF-Dokument zu extrahieren. |
Konfigurationsdatei |
PDF2Data.properties |
Beschreibung
Dieser Preparser dient dazu Informationen aus einem PDF-Dokument zu extrahieren und daraus eine JSON-Datei zu erzeugen.
Das Dokumente wird via HTTPS an den Machine-Learning-Service unseres Partners contract.fit gesendet. Die Textbausteine werden durch eine optische Zeichenerkennung (Optical Character Recognition, OCR) extrahiert.
Der Zugang zu unserem Partner ist kostenpflichtig. Bei Erwerb wird dieser für Sie von uns konfiguriert. Bei Interesse wenden Sie sich bitte an unsere Mitarbeiter im Support bzw. im Vertrieb.
Die Konfiguration erfolgt über eine Properties-Datei, in welcher folgende Parameter definiert werden können.
Parameter
Parameter |
Beschreibung |
Synchronous |
Gibt an, ob der Service synchron (true) oder asynchron (false) aufgerufen werden soll. Default: false. Wichtiger Hinweis: Bei asynchronem Aufruf muss Lobster_data von außen per HTTPS erreichbar sein. |
ChannelID |
Kanal-ID eines HTTPS-Kanals mit Basic Authentication (Preemptive Authentication). |
useDMZ |
Gibt an, ob der Service via DMZ aufgerufen werden soll. Default: false. |
URL |
URL für contract.fit-System inklusive Inbox ID (siehe Beispiel). Hinweis: Jeder Dokumententyp (z. B. Rechnung, Bestellung, usw.) wird als einzelne Inbox auf der contract.fit-Plattform definiert. Die Struktur der Response-JSON-Datei (Felder) ist abhängig von der Inbox ID. |
Beispiel-Datei
Synchronous=true
ChannelID=1599728356339212
useDMZ=false
URL=https://lobster.contract-q.fit/admin/documents/5e7a390a3b08c6d23ab8b8c4
Hinweis: Der Wert 5e7a390a3b08c6d23ab8b8c4 ist hier die Inbox ID.
Quellstruktur erzeugen
Um eine zur jeweiligen JSON-Datei passende Quellstruktur zu erzeugen, kann folgendermaßen vorgegangen werden.
Profil erzeugen mit Einstellung Kein Mapping.
Preparser konfigurieren.
Checkbox Ergebnis vom Preparser überschreibt Backup-Datei setzen.
Nach einem Profil-Lauf kann dann die Backup-Datei des Jobs benutzt werden über den Quellstruktur-Menü-Eintrag Struktur aus Datei-Analyse erzeugen.