ExcelSplitter
Gruppe |
|
Funktion |
Kann Excel-Tabellenblätter als CSV-Dateien extrahieren. Gibt eine Liste von Datei- und Tabellenblätter-Namen zurück. |
Konfigurationsdatei |
Optionale Properties-Datei, siehe Beispiele. Alternativ kann ein Verzeichnis angegeben werden, in das dann alle Excel-Tabellenblätter mit alle Zeilen extrahiert werden. |
Beschreibung
Dieser Preparser kann Excel-Tabellenblätter als CSV-Dateien extrahieren. Gibt eine Liste mit Einträgen folgenden Formats zurück.
<Kompletter Dateipfad der CSV-Datei>;<Anzahl der geschrieben Zeilen>;<Tabellenblattname> |
Parameter |
Beschreibung |
dir |
Das Zielverzeichnis, siehe Beispiele. |
sheet.include.names |
(optional) Explizite Angabe der Namen der auszugebenden Tabellenblätter. Siehe Beispiele. |
sheet.include.numbers |
(optional) Explizite Angabe der Nummern der auszugebenden Tabellenblätter. Siehe Beispiele. |
sheet.exclude.names |
(optional) Explizite Angabe der Namen der Tabellenblätter, die nicht auszugeben sind. Siehe Beispiele. |
sheet.exclude.numbers |
(optional) Explizite Angabe der Nummern der Tabellenblätter, die nicht auszugeben sind. Siehe Beispiele. |
skipHiddenRows |
(optional) Falls true, werden nur sichtbare Zeilen der Tabellenblätter ausgegeben. Default: false. |
chunk.size |
(optional) Die CSV-Dateien enthalten immer eine Header-Zeile SheetName;<Name des Sheets>. Danach kommen chunk.size Daten-Zeilen, bevor erneut die Header-Zeile geschrieben wird. Die Header-Zeile wird nicht berücksichtigt bei der Berechnung der Chunk-Größe. Damit kann später im Parser die Anzahl der Datenblättern gesteuert werden (siehe auch Abschnitt TokenFileSplitter). Hinweis: Es werden nur Ganzzahlen größer 0 beachtet. |
recalculate.formula |
(optional) Falls false, dann werden Formeln nicht neu berechnet. Kann verwendet werden, wenn in Ausnahmefällen die Neuberechnung komplizierter Formeln nicht funktioniert. Default: true. |
Beispiele
Beispiel 1
dir=/excel-output/samples
sheet.include.names=Articles;Orders
sheet.include.numbers=3;9
skipHiddenRows=true
chunk.size=20000
Es werden nur sichtbare Zeilen der Tabellenblätter mit den Namen Articles und Orders, sowie Tabellenblatt 3 und 9 geschrieben. Jede CSV-Datei enthält nach 20000 Zeilen den Header.
Beispiel 2
dir=/excel-output/samples
sheet.exclude.names=Articles;Orders
sheet.exclude.numbers=3;9
skipHiddenRows=true
Es werden nur sichtbare Zeilen aller Tabellenblätter geschrieben, die nicht Articles oder Orders genannt, bzw. die nicht Tabellenblatt 3 oder 9 sind.
Beispiel 3
Wird exclude und include zusammen benutzt, gewinnt am Ende exclude, wenn die Definition nicht bei include greift.
dir=/excel-output/samples
sheet.include.names=Articles;Orders
sheet.exclude.names=Articles;Orders
skipHiddenRows=true
Articles und Orders werden geschrieben.
dir=/excel-output/samples
sheet.include.names=Articles;Orders
sheet.exclude.names=Shops
Es werden alle Tabellenblätter geschrieben, die nicht Shops genannt sind, sowie Tabellenblatt Articles oder Orders.