Overkill und Underkill- bei Adreß-Doubletten

03.09.1976

- Kaum ein Computersystem, auf dem nicht auch Adreßdateien geführt werden. Kaum ein Zeitgenosse, der von irgendwelchen Versendern Material nicht doppelt erhält. Wie kommen die Doubletten in den Adreßbeständen zustande?

In erster Linie durch schlecht lesbare Schrift der Kunden, insbesondere der Gastarbeiter, durch telefonische Bestellannahme, durch Straßenumbenennungen und auch dadurch, daß ältere Menschen noch altdeutsch schreiben, was von den jüngeren Datentypistinnen nicht mehr gelesen werden kann.

-Solche Doubletten sind nicht nur ärgerlich, sie verursachen auch Kosten, insbesondere dann, wenn teure Werbemittel doppelt versandt werden.

An Ärgernissen kommt intern noch hinzu, daß Statistiken verfälscht werden, extern, daß Doppelversand für den Absender ein schlechtes Image schafft.

- Also sollte man sich systematisch um die Aussortierung von Adreßdoubletten bemühen. Wo - bei wie hohem Adreßbestand - ist da die Schwelle?

Diese Schwelle würde ich sehr niedrig ansetzen. Bei mehr als 5000 Adressen läßt sich ein Adreßbestand bereits nicht mehr von Doubletten freihalten.

- Was sind die gängigsten Verfahren, um Doppeladressen zu vermeiden?

Das fängt bereits bei der Erfassung an. Hier ist dafür zu sorgen, daß ein sehr strenges Reglement auch eingehalten wird, das heißt, daß bestimmte Adreßteile in einer ganz bestimmten Folge in die dafür bestimmten Felder eingegeben werden müssen. Gegebenenfalls müssen bestimmte Teile der Adresse von Fachkräften vorcodiert werden, bevor das Material zur Datenerfassung gelangt. Wir bei Neckermann verwenden bei der Adreßerfassung seit Jahren das sogenannte Match-Code-Verfahren. Hierbei wird bei der Eingabe vom System automatisch aus bestimmten Teilen der Adresse ein 14stelliger Schlüssel aufgebaut, der mit der Match-Code-Datei aller bereits bestehenden Adreßschlüssel abgeglichen wird. Trotzdem kann auf diese Weise der Adreßbestand nicht frei von Doubletten gehalten werden. Dagegen hilft die herkömmliche Methode, den gesamten Adreßbestand in diversen Sortierfolgen aufzulisten und visuell nach Doubletten zu untersuchen. Diese Aufgabe läßt sich inzwischen jedoch wesentlich eleganter lösen durch spezielle Software, die die Adressen in ihre Einzelteile zerlegt und diese phonetisch miteinander abgleicht. Das heißt, diese Programme finden phonetisch gleich klingende Doubletten, zum Beispiel Schneemann und Seemann oder Weitmann und Weidmann.

- Zu den drei letzten Verfahren ist sicherlich noch manches zu fragen. Zum Beispiel: Wie kommen Doubletten denn Oberhaupt in die Adreßbestände rein, wenn bereits nach Match-Code-Verfahren geprüft wird?

Das Match-Code-Verfahren ist nach Ansicht der Fachleute heute inzwischen überholt. Da zum Beispiel grundsätzlich der erste Buchstabe des Familiennamens Bestandteil des Match-Codes ist, wird nicht verhindert, daß wegen schlechter Schreibweise ein Name Hegener neu akzeptiert wird, obwohl er bereits als Jegener erfaßt ist. Ein zweites Manko ist die erforderliche Mitwirkung der Typistin, die übersehen kann, daß bereits ein identischer Match-Code vorliegt.

- Und wie arbeitet man mit den Auflistungen, welche Sortierfolgen sind da sinnvoll?

Die Standard-Sortierfolge ist die Postleitzahl, der Ort, der Familienname, die Straße. Hierdurch können zum Beispiel alle Müllers oder Schmidts eines Ortes oder Stadtteiles zusammengeführt und auf Doubletten untersucht werden. Eine zweite verfeinerte Methode ist die Sortierung nach Straßen innerhalb eines Ortes. Hierdurch ist es möglich, alle Bewohner einer Straße oder eines Gebäudes zusammenzuführen, auch wenn der Familienname unterschiedlich ist.

- Ist denn das nicht extrem aufwendig, insbesondere in Ihrem Hause, in dem 8 Millionen Adressen gespeichert werden?

Das kann man wohl sagen. Zwar waren bei uns die Auflistungen für andere Arbeiten ohnehin erforderlich und diese Arbeit konnte als Füllarbeit in arbeitsschwachen Stunden erledigt werden, trotzdem wurden immer wieder Doubletten übersehen, weil bei weit auseinanderliegenden Doppeladressen das menschliche Gedächtnis doch sehr schnell versagt. Zum Beispiel bei "Waschsalon Binder" auf der einen Seite und "Binder, Adolf" mit gleicher Adresse auf der anderen Seite.

- Die Computerprogramme für phonetisches Abgleichen von Adreßbeständen sollen nun Abhilfe schaffen. Was gibt es da auf dem Software-Markt?

Es gibt über ein halbes Dutzend Programme auf dem Markt, die in etwa alle nach dem gleichen System arbeiten. Zwei davon haben wir in die engere Wahl gezogen: Das Paket Mailsafe und das Paket Uni-Mail. Letzteres haben wir schließlich von der Firma Uniserv in Pforzheim gekauft.

- Vielleicht noch einen Satz dazu, wie solches phonetisches Abgleichen funktioniert.

Zunächst wird jede Adresse in Teile zerlegt und jedes Teil wird unterschiedlich gewichtet. Die für einen Programmlauf für wichtig erachteten Elemente werden anschließend nach'; phonetischen Regeln vercodet, wobei beispielsweise die Buchstabenkombination ai, ay, ei, ey und so weiter vom vielzitierten Meier den jeweils gleichen Code erhalten. Haben zwei Adressen in ihren sämtlichen Teilen denselben Code, handelt es sich mit hundertprozentiger Wahrscheinlichkeit um eine Doublette. Ich kann nun festlegen, daß mir nur derartige Pärchen ausgedruckt werden. Interessant sind für mich aber auch die Adreßgruppen, deren Codes nur zu 90 oder gar nur 70 Prozent übereinstimmen, denn so erhalte ich doublettenverdächtige Pärchen, beispielsweise den oben zitierten Waschsalon Binder des Herrn Adolf Binder. Allerdings darf ich diese erkannten Doubletten nicht einfach umspeichern lassen, denn beispielsweise könnte der Herr Adolf Binder der Vater des Waschsalon-Inhabers sein. Es bedarf also noch einer sorgfältigen Nachbearbeitung der erkannten Doubletten, gegebenenfalls sogar der Rückfrage. Bei zu niedrig angesetzter Toleranzgrenze produziert das Programm sogenannte Overkills. Würde ich jedoch nur die Adressen mit hundertprozentiger Identität - herausfiltern lassen, entständen mit Sicherheit Underkills, das heißt ich würde die darüber hinaus vorhandenen Doubletten nicht angezeigt bekommen.

- Das klingt ja sehr martialisch.

Das kommt noch schlimmer: Unter Fachleuten nennt man den Parameter für die Festlegung der Toleranzgrenzen auch "die Killrate".

- Sie haben im Hause Neckermann etwa 8 Millionen Adressen gespeichert, davon werden rund 5 Millionen ständig bewegt. Wie viele davon sind denn nun Doubletten?

Ich schätze im aktiven Bestand zirka ein Prozent an Doppeladressen, das sind immerhin 50 000. Auch wenn nur ein Teil hiervon das gleiche Werbematerial tatsächlich doppelt erhält, werden sich die Kosten für das Programmpaket und die Maschinenzeit kurzfristig amortisieren.

- Künftig werden Sie ja häufiger phonetische Adreßabgleiche fahren. Welchen Anteil werden künftig die Doppeladressen am Gesamtbestand i haben?

Bei ein- oder zweimal jährlichem Abgleich des Ist-Bestandes hoffen wir den Doubletten-Stand auf zirka 1 Promill zu drücken. Mittelfristig planen wir, bei der Adreßerfassung das hochkömmliche Mateh-Code-Verfahren durch das Phonetikverfahren zu setzen.

Bert-Dieter Lehmann (42), feiert im nächsten Monat zwanzigjährige Betriebszugehörigkeit zur Firma Neckermann. 1962 übernahm er dort die Abteilung Kundenkartei, die mit der Einführung der Bildschirm-Adreßverwaltung (bereits 1970) in "Kundendatei" umbenannt wurde. Dort wird mit 46 Bildschirmen (Zwei-Schicht-Betrieb) die integrierte Neckermann-Andreßkartei verwaltet, insbesondere für Fakturierung, Marketing-Planung und Direktwerbe-Aktionen.