Reguläre Ausdrücke
In der Informatik ist ein regulärer Ausdruck eine Zeichenkette, die der Beschreibung von Mengen, beziehungsweise Untermengen von Zeichenketten mithilfe bestimmter syntaktischer Regeln dient.
Reguläre Ausdrücke stellen eine Art Filterkriterium für Texte dar, indem der jeweilige reguläre Ausdruck mit dem Text abgeglichen wird. So ist es beispielsweise möglich, alle Wörter, die mit S beginnen und mit d enden, zu matchen (von Englisch "to match" = "auf etwas passen"/"übereinstimmen"/"eine Übereinstimmung finden"), ohne die dazwischenliegenden Buchstaben explizit vorgeben zu müssen. Der reguläre Ausdruck dafür wäre: S.*d
Dabei werden Zeichen, die direkt übereinstimmen müssen, auch direkt notiert.
Ein beliebiges Zeichen wird durch . abgebildet.
Eine Zeichenauswahl wird durch [abc] abgebildet. Ein Bereich kann dabei auch angegeben werden, z. B. [a-zA-Z]
Quantoren (engl. quantifier, auch Quantifizierer oder Wiederholungsfaktoren) erlauben es, den vorherigen Ausdruck in verschiedener Vielfachheit in der Zeichenkette zuzulassen.
? |
Der voranstehende Ausdruck ist optional, er kann einmal vorkommen, muss es aber nicht, d. h. der Ausdruck kommt keinmal oder einmal vor. |
+ |
Der voranstehende Ausdruck muss mindestens einmal vorkommen, darf aber auch mehrfach vorkommen. |
* |
Der voranstehende Ausdruck darf beliebig oft (auch keinmal) vorkommen. |
{n} |
Der voranstehende Ausdruck muss exakt n-mal vorkommen. |
{min,} |
Der voranstehende Ausdruck muss mindestens min-mal vorkommen. |
{,max} |
Der voranstehende Ausdruck darf maximal max-mal vorkommen. |
{min,max} |
Der voranstehende Ausdruck muss mindestens min-mal und darf maximal max-mal vorkommen. |
Reguläre Ausdrücke arbeiten immer zeilenweise. Wenn ein regulärer Ausdruck über mehrere Textzeilen gehen soll, muss der Operator (?s) vorangestellt werden.
Entwicklungshilfe
Es gibt ein eigenes Plugin zur Unterstützung der Entwicklung regulärer Ausdrücke. Im Internet finden sich zudem zahlreiche Tutorials und Tools, um mehr über reguläre Ausdrücke zu erfahren.