ExtractFileFromPDF

Gruppe

Preparser

Klassenname

com.ebd.hub.datawizard.parser.ExtractFileFromPDF

Funktion

Kann beliebige angehängte Datei aus einer PDF/A-Datei auslesen.

Konfigurationsdatei

Keine notwendig. Konfiguration erfolgt nur durch einen String im Feld Konfigurationsdatei.

Beschreibung

Dieser Preparser kann aus einer PDF/A-Datei eine beliebige Anhangsdatei auslesen (jenseits der Datei ZUGFeRD-invoice.xml).

Im Feld Konfigurationsdatei gibt man dazu die Liste von möglichen Dateinamen (mit ; getrennt) an. Es wird immer nur die erste gefundene Datei zurück gegeben. Siehe folgendes Beispiel.

Beispiel


Nehmen wir folgenden Wert im Parameter-String an.

MyInvoice.txt;Orders.csv

Sind beide Dateien im PDF/A enthalten, wird die Datei MyInvoice.txt verarbeitet, wenn sie als erstes ins PDF eingefügt wurde.


Wichtiger Hinweis: Wenn Sie eine PDF/A-Datei in einem Viewer öffnen, werden nicht immer die echten Dateinamen der angehängten Dateien angezeigt. Nehmen wir an Sie sehen im Viewer den Dateinamen abadoc.xml und geben diesen so im Parameter-String an. Ist der tatsächliche Dateiname anders, dann erhalten Sie eine Fehlermeldung folgender Art.

[unknown] No valid embedded file found but these are included: 'AbaDoc', 'ZUGFeRD-invoice.xml'
[ExtractFileFromPDF] Exception in PreParser: java.lang.Exception: Invalid PDF/A format - unable to extract file

Geben Sie dann stattdessen den Dateinamen AbaDoc an.