Kleine Helfer

Reguläre Ausdrücke leicht gemacht

22.10.2004
Kostenfreie oder kostengünstige Software, die einem IT-Profi das Leben leichter macht.

Reguläre Ausdrücke ("Regex") sind ein mächtiger Mechanismus zur Beschreibung von Textmustern. Sie haben eine lange Tradition in diversen Unix-Tools, haben mittlerweile aber auch Eingang in Javascript oder in rudimentärer Form sogar in MS Word gefunden. Die Syntax für solche Ausdrücke ist nicht ganz einfach zu verstehen, und zu allem Überfluss weichen die Implementierungen in den verschiedenen Tools voneinander ab.

"Txt2regex" (http://txt2regex.sourceforge.net/) ist ein einfaches und freies Werkzeug, das Gelegenheitsnutzern bei der Regex-Formulierung unter die Arme greift. Es handelt sich dabei um ein Skript für die freie Unix-Shell "bash". Es läuft auch problemlos in deren Cygwin-Portierung (http://www.cygwin.com/) unter Windows. Das Tool präsentiert ein einfaches Menü im Textmodus, mit dessen Hilfe man sich Schritt für Schritt durch ein geplantes Textmuster arbeiten kann. Es unterstützt bei der Erstellung von Listen für Zeichen, die in einem String vorkommen können oder dort nicht enthalten sein dürfen. Bei der Wiederholung von Teilmustern wählt es den passenden Quantifizierungsoperator und lässt auch die Alternation mittels '|' sowie die Bildung von Gruppen mit Hilfe von Klammern zu.

Die größte Stärke von txt2regex besteht darin, dass es einen regulären Ausdruck parallel in unterschiedlicher Syntax für bis zu 24 Anwendungen erzeugt. Darin besteht auch seine größte Schwäche, weil es nur den kleinsten gemeinsamen Nenner unterstützt. Fortgeschrittene Features, wie sie in Perl üblich sind, fehlen dementsprechend. Dazu zählen etwa Escape-Sequenzen wie '\w' für alphabetische Zeichen oder Schalter, mit denen sich das Verhalten der Regex-Engine steuern lässt (/i /s /x). Wer Hilfe für Perl-konforme Regex benötigt, ist daher mit dem deutlich mächtigeren und komfortableren "Regex Coach (http://weitz.de/regex-coach)" besser bedient. Es handelt sich dabei um eine grafische Anwendung für Windows und Linux (wobei für Letzteres Motif vorausgesetzt wird). (ws)

CW-Fazit: txt2regex hilft bei der Formulierung von regulären Ausdrücken für 24 verschiedene Tools. Es beschränkt sich dabei auf einfachere Aufgaben und nutzt daher besonders regex-Anfängern.