Entwicklung von Data Dictionary-Anwendungsrichtlinien:

Unterstützung für den Datenadministrator

17.10.1980

Eine der wichtigsten Voraussetzungen vor dem eigentlichen Einsatz eines Data Dictionary (DD) Ist die Erstellung von eindeutigen Anwendungsrichtlinien in bezug auf Die Organisationsstruktur, Die Einsatzdefinition und Die Darstellung des Daten- und Dokumentationsinhaltes. Diese Richtlinien ermöglichen es dem Datenadministrator, eine zentrale Koordinationsfunktion zwischen Fach- und EDV-Abteilung mit Hilfe des Data Dictionary organisatorisch wahrzunehmen.

Software-Entwicklung ohne den Einsatz eines Data Dictionaries entspricht nicht mehr dem heute möglichen technologischen Stand. Diese Aussage gilt nicht nur bei Anwendung von Datenbank-Systemen, sondern trifft generell auf alle Phasen der computerunterstützten. Systementwicklung wie Systemplanung, Systementwurf, Systeminstallation und Systempflege zu. Innerhalb dieser Phasen soll mit dem DD dem Datenadministrator ein Instrument zur Verfügung gestellt werden, mit dem er unter anderem folgende Ziele erreichen kann:

- Vermeidung redundanter Datendefinitionen,

- Verwendung einer einheitlichen Terminologie,

- Übersicht über Verwendungsnachweise,

- Übersicht über Änderungsauswirkungen,

- Erstellung und Pflege einer aktuellen System- und Datendokumentation,

- Auskunftsbereitschaft (online!) über alle DD-lnformationen.

Obwohl jede Phase von ihrem Informationsgehalt unterschiedliche Detailstufen aufweist, gibt es eine kontinuierliche und logische Übereinstimmung über Zweck, Inhalt und Verwendung dieser Informationen. Diese Übereinstimmung und damit die Funktionsbasis für den Datenadministrator kann durch eine klar festgelegte Vorgehensweise unter Einhaltung von Standardrichtlinien erreicht werden.

Vorgehensweise

Unter Berücksichtigung bereits vorhandener Organisationsrichtlinien werden je Systemphase die im Data Dictionary zu definierenden Informationsstufen festgelegt (Abbildung 1 zeigt ein Beispiel für die Systementwurfsphase). Gleichzeitig werden die Strukturbildungen und Verknüpfungen, mit den zugehörigen beziehungsweise übergeordneten Informationseinheiten beschrieben.

Der Daten- und Dokumentationsinhalt kann danach wie folgt festgelegt werden:

- Standardangaben für alle Informationsstufen

- Individuelle Angaben je Informationsstufe.

Darauf aufbauend sollten, abhängig von den Auswertungsmöglichkeiten des Data Dictionary; auch Standardauswertungen wie

- Auflistung aller lnformationseinheiten in bestimmten Reihenfolgen (Ordnungsbegriff, Kurzbezeichnung etc.)

- Auflistung je Informationseinheit mit Verwendungsnachweis

- Auflistung nach Stichworten (Klassifikation, Verantwortlichkeit etc.)

- Ausdruck aller verwendeten Datennamen (COBOL, PL/1, DBMS etc.)

vorgegeben werden, um allen Interessenten in Fach- und EDV-Abteilungen eine zentrale Dokumentations und Datenübersicht zu liefern.

Stufen der Standardisierung

Wie bereits erwähnt, können die zu bildenden Anwendungsrichtlinien auf zwei Ebenen festgelegt werden:

A. Standardangaben für alle Informationsstufen

Neben einem identifizierenden Schlüssel, Kurztext, Langtext etc. werden für jede Informationsstufe Standardangaben vereinbart, die es dem Datenadministrator sowie allen interessierten Stellen ermöglichen, das Data Dictionary nach diesen Angaben auszuwerten und zu überprüfen.

Dies ist speziell für den Datenadministrator von Bedeutung, da dieser als eine seiner Hauptfunktionen darauf

zu achten hat, daß gleiche Informationselemente (Datenelemente) nicht mehrfach definiert werden. Daraus resultierend, muß er die Möglichkeit haben, im Data Dictionary bereits gespeicherte Informationseinheiten und -elemente mit Hilfe dieser Standardkriterien zu analysieren und den Anforderungen entsprechend zur Verfügung zu stellen.

Zwei Beispiele sollen verdeutlichen welche Angaben wie angewendet werden können.

A. 1. Daten-Klassifikation

Mit der Angabe einer Klassifikation soll eine Einordnung aller Datenelemente in gegebene Kategorien vorgenommen werden. Die Klassifizierung 5011 dem Anwendungsanalytiker und dem Datenadministrator Hinweise über Struktur, Art und Verwendung des Items sowie sonstige dazu erforderliche Informationen geben. Mehrfach-Klassifikation muß möglich sein Es gibt Klassifikationen, die für alle Datenelemente der verschiedenen Stufen gelten (im angegebenen Beispiel die DUMMY-Angabe, falls keine andere CLASS-Angabe in Frage kommt). Daneben sind für spezielle Datenstufen Klassifikationen vorzusehen, die zum Beispiel die System-Variablen (SYSTEM) oder DBS-Schlüssel (INDEX) kennzeichnen, die auf Intervallgrenzen oder Tabellen hinweisen (INTVAL, TAB), die die Art der Variablen angehen (zum Beispiel personenbezogen, Mengenangabe), die Stamm- und Bewegungsdaten unterscheiden (STAMM, BEWEG), die Belange des Datenschutzes einbeziehen (VTRAUL, DATSCH), die die Programmiersprache der Programme festhalten (COBOL, FORT4, PL/1). Die angegebene Tabelle (Abb. 2j soll als Anwendungsbeispiel gelten. Die vereinbarten Klassifikationen müssen den individuellen Bedürfnissen des DD-Anwenders angepaßt sein, das heißt, durch den Datenadministrator bei Einführung des DD in Absprache mit den Anwendungsabteilungen gestaltet und gegebenenfalls später auch erweitert werden.

Anwendungsbeispiel:

Der Datenadministrator erhält die Anforderung, für einen bestimmten Datensatz eine Datum-Angabe mit Monatstext bereitzustellen.

Durch Verwendung des Suchkriteriums "DATUM" erhält er aus dem DD alle Datenfelder mit dieser Klassifikationsangabe und kann sofort feststellen, ob nicht bereits ein derartiges Datenfeld existiert.

A.2. Datenverantwortlichkeiten

Die vielfache Verwendung gleicher Informationsstufen und -elemente von verschiedenen Projektgruppen gerade bei der Entwicklung integrierter EDV-Systeme macht es erforderlich, die jeweils Verantwortlichen zu kennzeichnen, die als erstes ein Datenelement eingeführt haben und für dessen weitere standardisierte Pflege verantwortlich sind. Es muß möglich sein, diese und alle weiteren Anwender hinreichend schnell über alle Erweiterungen und Modifikationen zu dem betroffenen Element zu unterrichten und eine Abstimmung herbeizuführen. Deshalb sind jedem Element die betroffenen, Verantwortlichen (siehe Abb. 3) zuzuordnen, Mehrfachbenennung muß möglich sein. Die Verantwortlichkeit kann auch personenbezogen (Personal-Nr.) angegeben werden, doch sollte die dabei meist anfallende Anderungshäufigkeit berücksichtigt werden.

Anwendungsbeispiel:

Das Datenfeld "Kunden-Kontonummer" enthält im DD die Verantwortlichkeitsinformation "FAKSY1" und "DEBSY4". Der Datenadministrator kann durch Aufruf dieses Datenfeldes am Bildschirm sofort erkennen, welche Fachteilung beziehungsweise Projektgruppe bei einer Änderungsanforderung (Feldformat) betroffen und deshalb zu benachrichtigen ist.

B. Individuelle Angaben je Informationsstufe

Abhängig von den Möglichkeiten des Data Dictionary sowie den jeweiligen Informationsstufen ergeben sich stufenspezifische Angaben, von denen die wichtigsten am Beispiel des Datenfeldes kurz angeführt werden.

- Datenformat

- Speicherform

- Feldlänge

- Dezimalstellen

- Ein-, Ausgabeformat

- Datenname (je Programmiersprache, Alias-Bezeichnungen, Datenbankname)

- Versionsnummer; Versionsdatum

- Prüfkriterien (erlaubte Werte, Intervallangaben, Plausibilitäten etc.)

- Tabellenzuordnungen

- Berichtsaufbereitungsangaben

(Aufbereitungsformat, Überschrift-Text etc.)

- Test-/ Produktionsstatus.

Diese Angaben sollten in ihrer Definitionsform ebenfalls so aufgebaut werden, daß sie für den Datenadministrator nach bestimmten Kriterien auswertbar zur Verfügung stehen Standardrichtlinien sind hier aber wesentlich von den Möglichkeiten des jeweiligen DD abhängig.

Folgerung

Ohne im einzelnen auf die Vorteile einer Data Dictionary-Anwendung einzugehen, soll ergänzend darauf hingewiesen werden, daß für einen sinnvollen Einsatz der DD-Möglichkeiten die Wahrnehmung dieser Vorteile wie

- Grundlage für die Analyse bezüglich Datenbankentwurf und Inhalt von Stammdaten,

- Grundlagen für Aufwandschätzungen für die Installationsphase.

- Generierung von Datensätzen und Datenbank-Beschreibungen,

- Test- und Produktionsüberwachung, u

- sofortiger Überblick von Änderungsauswirkungen,

- automatische Pflege der System- und Datendokumentation

bereits am Anfang erstellter Anwendungsrichtlinien eine ausgezeichnete Grundlage bieten.

Darüber hinaus wird eine wichtige Basis für die Verwendung einer einheitlichen Terminologie zwischen Fachabteilungen und Projektgruppen geschaffen.

*Dr. Uwe Kassner, KIGST, Köln; Gerhard Aichberger, Arthur Andersen & Co., Frankfurt/M.