Fuzzy Double V4 toleriert Abweichungen

Spürnase für fehlerhafte Datenbankeinträge

12.11.1999
MÜNCHEN (CW) - Suchsoftware in Datenbanken ist angesichts fehlerhafter Einträge und Dubletten oft überfordert. Durch den Einsatz fehlertoleranter Logik verspricht die Ludwigsburger Fuzzy Informatik AG, die Suche zu erleichtern und Daten auf Vordermann zu bringen.

Datenbanken oder Data-Warehouse-Anwendungen verwalten meist große Datenvolumina. Dabei läßt es sich kaum vermeiden, daß Dubletten und fehlerhafte Einträge entstehen. Auf bis zu 20 Prozent schätzen die Softwerker von Fuzzy diese Fehlerrate. Wie lassen sich Dubletten nun sicher erkennen, bevor sie angelegt werden? Wie kann man einen einmal falsch erfaßten Kunden zwischen Millionen anderer Kundendaten wiederfinden?

Das Such- und Dublettenerkennungsprogramm "Fuzzy Double V4" verspricht hier eine Lösung. Herkömmliche Suchprogramme von Datenbanken arbeiten mit binärer Logik. Ein solches Programm wird aber nur in denjenigen Fällen fündig, wo die Suchanfrage mit dem Datenbankeintrag genau übereinstimmt. Mit Fuzzy Double V4 sollen sich Einträge finden lassen, auch wenn die tatsächliche Zeichenfolge vom eingegebenen Suchbegriff abweicht oder wenn Vor- und Nachnamen vertauscht worden sind. Dazu läßt das Programm eine Fehlertoleranz zu. Das Verfahren wird als "unscharfes Matching" bezeichnet (siehe Kasten "Was ist Fuzzy-Logik?").

Die Suchsoftware läßt sich in bestehende Datenbanksysteme etwa von Oracle integrieren. Eine API-Schnittstelle stellt die Verbindung zu den Anwendungen her, die die Suchfunktionen nutzen sollen.

Der Hauptanwendungsbereich ist das Kunden- und Adreß-Management, in dem fehlerhafte oder doppelte Einträge oft zu unerwünschten Mehrkosten führen, da Kunden mehrfach oder auch gar nicht angeschrieben werden. Solche maroden Datenbankeinträge sollen sich noch vor dem Anlegen mit dem Tool erkennen lassen. Ein weiteres Einsatzfeld ist die Suche von Warenzeichen, Büchern oder Musiktiteln, wie Detlev Siech, Vorstand von Fuzzy Informatik, mitteilt.

Das Programm läuft auf Unix und Windows NT. Eine Anbindung an Mainframe-Umgebungen wie OS/390 und BS2000 soll ebenfalls möglich sein. Damit auch Benutzer der am weitesten verbreiteten ERP-Software SAP R/3 die fehlertolerante Suchlogik nutzen können, haben die Ludwigsburger vor kurzem die Integration in das R/3-System realisiert.