ExcelSplitter

Gruppe

Preparser

Funktion

Kann Excel-Tabellenblätter als CSV-Dateien extrahieren. Gibt eine Liste von Datei- und Tabellenblätter-Namen zurück.

Konfigurationsdatei

Optionale Properties-Datei, siehe Beispiele. Alternativ kann ein Verzeichnis angegeben werden, in das dann alle Excel-Tabellenblätter mit alle Zeilen extrahiert werden.

Beschreibung


Dieser Preparser kann Excel-Tabellenblätter als CSV-Dateien extrahieren. Gibt eine Liste mit Einträgen folgenden Formats zurück.


<Kompletter Dateipfad der CSV-Datei>;<Anzahl der geschrieben Zeilen>;<Tabellenblattname>


Parameter

Beschreibung

dir

Das Zielverzeichnis, siehe Beispiele.

sheet.include.names

(optional) Explizite Angabe der Namen der auszugebenden Tabellenblätter. Siehe Beispiele.

sheet.include.numbers

(optional) Explizite Angabe der Nummern der auszugebenden Tabellenblätter. Siehe Beispiele.

sheet.exclude.names

(optional) Explizite Angabe der Namen der Tabellenblätter, die nicht auszugeben sind. Siehe Beispiele.

sheet.exclude.numbers

(optional) Explizite Angabe der Nummern der Tabellenblätter, die nicht auszugeben sind. Siehe Beispiele.

skipHiddenRows

(optional) Falls true, werden nur sichtbare Zeilen der Tabellenblätter ausgegeben. Default: false.

chunk.size

(optional) Die CSV-Dateien enthalten immer eine Header-Zeile SheetName;<Name des Sheets>. Danach kommen chunk.size Daten-Zeilen, bevor erneut die Header-Zeile geschrieben wird. Die Header-Zeile wird nicht berücksichtigt bei der Berechnung der Chunk-Größe. Damit kann später im Parser die Anzahl der Datenblättern gesteuert werden (siehe auch Abschnitt TokenFileSplitter). Hinweis: Es werden nur Ganzzahlen größer 0 beachtet.

recalculate.formula

(optional) Falls false, dann werden Formeln nicht neu berechnet. Kann verwendet werden, wenn in Ausnahmefällen die Neuberechnung komplizierter Formeln nicht funktioniert. Default: true.

Beispiele


Beispiel 1


dir=/excel-output/samples
sheet.include.names=Articles;Orders
sheet.include.numbers=3;9
skipHiddenRows=true
chunk.size=20000


Es werden nur sichtbare Zeilen der Tabellenblätter mit den Namen Articles und Orders, sowie Tabellenblatt 3 und 9 geschrieben. Jede CSV-Datei enthält nach 20000 Zeilen den Header.

Beispiel 2


dir=/excel-output/samples
sheet.exclude.names=Articles;Orders
sheet.exclude.numbers=3;9
skipHiddenRows=true


Es werden nur sichtbare Zeilen aller Tabellenblätter geschrieben, die nicht Articles oder Orders genannt, bzw. die nicht Tabellenblatt 3 oder 9 sind.

Beispiel 3


Wird exclude und include zusammen benutzt, gewinnt am Ende exclude, wenn die Definition nicht bei include greift.


dir=/excel-output/samples
sheet.include.names=Articles;Orders
sheet.exclude.names=Articles;Orders
skipHiddenRows=true


Articles und Orders werden geschrieben.


dir=/excel-output/samples
sheet.include.names=Articles;Orders
sheet.exclude.names=Shops


Es werden alle Tabellenblätter geschrieben, die nicht Shops genannt sind, sowie Tabellenblatt Articles oder Orders.