ExcelSplitter
|
Gruppe |
|
|
Funktion |
Kann Excel-Tabellenblätter als CSV-Dateien extrahieren. Gibt eine Liste von Datei- und Tabellenblätter-Namen zurück. |
|
Konfigurationsdatei |
Optionale Properties-Datei, siehe Beispiele. Alternativ kann ein Verzeichnis angegeben werden, in das dann alle Excel-Tabellenblätter mit alle Zeilen extrahiert werden. |
Beschreibung
Dieser Preparser kann Excel-Tabellenblätter als CSV-Dateien extrahieren. Gibt eine Liste mit Einträgen folgenden Formats zurück.
|
<Kompletter Dateipfad der CSV-Datei>;<Anzahl der geschrieben Zeilen>;<Tabellenblattname> |
|
Parameter |
Beschreibung |
|
dir |
Das Zielverzeichnis, siehe Beispiele. |
|
sheet.include.names |
(optional) Explizite Angabe der Namen der auszugebenden Tabellenblätter. Siehe Beispiele. |
|
sheet.include.numbers |
(optional) Explizite Angabe der Nummern der auszugebenden Tabellenblätter. Siehe Beispiele. |
|
sheet.exclude.names |
(optional) Explizite Angabe der Namen der Tabellenblätter, die nicht auszugeben sind. Siehe Beispiele. |
|
sheet.exclude.numbers |
(optional) Explizite Angabe der Nummern der Tabellenblätter, die nicht auszugeben sind. Siehe Beispiele. |
|
skipHiddenRows |
(optional) Falls true, werden nur sichtbare Zeilen der Tabellenblätter ausgegeben. Default: false. |
|
chunk.size |
(optional) Die CSV-Dateien enthalten immer eine Header-Zeile SheetName;<Name des Sheets>. Danach kommen chunk.size Daten-Zeilen, bevor erneut die Header-Zeile geschrieben wird. Die Header-Zeile wird nicht berücksichtigt bei der Berechnung der Chunk-Größe. Damit kann später im Parser die Anzahl der Datenblättern gesteuert werden (siehe auch Abschnitt TokenFileSplitter). Hinweis: Es werden nur Ganzzahlen größer 0 beachtet. |
|
recalculate.formula |
(optional) Falls false, dann werden Formeln nicht neu berechnet. Kann verwendet werden, wenn in Ausnahmefällen die Neuberechnung komplizierter Formeln nicht funktioniert. Default: true. |
Beispiele
Beispiel 1
dir=/excel-output/samplessheet.include.names=Articles;Orderssheet.include.numbers=3;9skipHiddenRows=truechunk.size=20000Es werden nur sichtbare Zeilen der Tabellenblätter mit den Namen Articles und Orders, sowie Tabellenblatt 3 und 9 geschrieben. Jede CSV-Datei enthält nach 20000 Zeilen den Header.
Beispiel 2
dir=/excel-output/samplessheet.exclude.names=Articles;Orderssheet.exclude.numbers=3;9skipHiddenRows=trueEs werden nur sichtbare Zeilen aller Tabellenblätter geschrieben, die nicht Articles oder Orders genannt, bzw. die nicht Tabellenblatt 3 oder 9 sind.
Beispiel 3
Wird exclude und include zusammen benutzt, gewinnt am Ende exclude, wenn die Definition nicht bei include greift.
dir=/excel-output/samplessheet.include.names=Articles;Orderssheet.exclude.names=Articles;OrdersskipHiddenRows=trueArticles und Orders werden geschrieben.
dir=/excel-output/samplessheet.include.names=Articles;Orderssheet.exclude.names=ShopsEs werden alle Tabellenblätter geschrieben, die nicht Shops genannt sind, sowie Tabellenblatt Articles oder Orders.