IntelligentDocumentAutomationPreParser

Gruppe

Preparser

Funktion

Dieser Preparser dient dazu Informationen aus einem PDF-Dokument zu extrahieren.

Konfigurationsdatei

PDF2Data.properties

Beschreibung


Dieser Preparser dient dazu Informationen aus einem PDF-Dokument zu extrahieren und daraus eine JSON-Datei zu erzeugen.

Das Dokumente wird via HTTPS an den Machine-Learning-Service unseres Partners contract.fit gesendet. Die Textbausteine werden durch eine optische Zeichenerkennung (Optical Character Recognition, OCR) extrahiert.

Der Zugang zu unserem Partner ist kostenpflichtig. Bei Erwerb wird dieser für Sie von uns konfiguriert. Bei Interesse wenden Sie sich bitte an unsere Mitarbeiter im Support bzw. im Vertrieb.

Die Konfiguration erfolgt über eine Properties-Datei, in welcher folgende Parameter definiert werden können.

Parameter


Parameter

Beschreibung

Synchronous

Gibt an, ob der Service synchron (true) oder asynchron (false) aufgerufen werden soll. Default: false. Wichtiger Hinweis: Bei asynchronem Aufruf muss Lobster_data von außen per HTTPS erreichbar sein.

ChannelID

Kanal-ID eines HTTPS-Kanals mit Basic Authentication (Preemptive Authentication).

useDMZ

Gibt an, ob der Service via DMZ aufgerufen werden soll. Default: false.

URL

URL für contract.fit-System inklusive Inbox ID (siehe Beispiel). Hinweis: Jeder Dokumententyp (z. B. Rechnung, Bestellung, usw.) wird als einzelne Inbox auf der contract.fit-Plattform definiert. Die Struktur der Response-JSON-Datei (Felder) ist abhängig von der Inbox ID.

Beispiel-Datei


PDF2Data.properties
Synchronous=true
ChannelID=1599728356339212
useDMZ=false
URL=https://lobster.contract-q.fit/admin/documents/5e7a390a3b08c6d23ab8b8c4


Hinweis: Der Wert 5e7a390a3b08c6d23ab8b8c4 ist hier die Inbox ID.

Quellstruktur erzeugen


Um eine zur jeweiligen JSON-Datei passende Quellstruktur zu erzeugen, kann folgendermaßen vorgegangen werden.



Nach einem Profil-Lauf kann dann die Backup-Datei des Jobs benutzt werden über den Quellstruktur-Menü-Eintrag Struktur aus Datei-Analyse erzeugen.