DD ist mehr als nur ein Wörterbuch:

IRM-Kernstück und zentrales Tool

16.06.1983

In Verbindung mit der Versionenverwaltung der im Data Dictionary abgelegten Entities bietet das Data-Dictionary-System zudem Unterstützung während des gesamten Entwicklungs- und Lebenszyklus von Informationssystemen, ausgehend von einer ersten Voruntersuchung über die Phasen Detailanalyse, Design, Realisierung bis hin zum Betrieb.

Das Data-Dictionary-System ist damit auf der einen Seite zum Kernstück des "Information Resource Management" (IRM) in einem Unternehmen geworden, einem System zur Verwaltung und Dokumentation des Unternehmensdaten/prozeß-Reservoirs (des Informationspotentials) und zur Organisation und Steuerung des Unternehmensdaten/prozeßeinsatzes, auf der anderen Seite ein zentrales Tool im Rahmen des Softwareengineering.

Aufgrund ihrer Flexibilität unterstützen einige der als Standardsoftware angebotenen Data-Dictionary-Systeme diesen weitreichenden Ansatz des "Information Resource Management" bereits sehr deutlich. Derartige Standardprodukte können jedoch lediglich als mehr oder weniger komfortable Basissysteme betrachtet werden.

Unternehmenspezifische Elemente

Um ein Information Resource Management mit solch umfassenden Aufgaben organisatorisch und EDV-technisch in die Unternehmenswelt zu integrieren, muß ein Anwenderunternehmen noch erheblich investieren. Abhängig von den im Softwareentwicklungsprozeß eingesetzten Methode und gegebenenfalls Tools, abhängig von den sonstigen Erfordernissen und Bedingungen, müssen unternehmensspezifische Elemente eingebracht werden:

- beim Aufbau eines Metadatenmodells,

- beim Erstellen der Metadatenbasis,

- bei der Entwicklung des Data-Dictionary-Basissystems,

- bei der organisatorischen Einbindung des Systems in das Unternehmen.

Bei der Erarbeitung eines Metadatenmodells für ein bestimmtes Unternehmen sind die vom Data-Dictionary-System zu verwaltenden Entity-Typen mit ihren beschreibenden Eigenschaften und ihren Beziehungen festzulegen.

Besonders hervorzuheben ist hier die Einteilung in eine konzeptionelle und eine implementationsbezogene Ebene der Metadaten, wie sie ähnlich in einem 1977 von der British Computer Society veröffentlichten Aufsatz getroffen wurde.

Entities spiegeln Informationsbedürfnis

Im Rahmen der Data-Dictionary-Diskussion ist die implementationsbezogene Sicht der Metadaten geläufig.

Sie ist die grundlegende Information über

- die implementierten EDV-Systeme,

- die in Entwicklung befindlichen EDV-Systeme,

aber nun auch über

- die manuellen datenverarbeitenden Systeme

im Unternehmen. Die zu dieser Sicht aufgeführten Entity-Typen spiegeln im wesentlichen die derzeitigen Informationsbedürfnisse der EDV-Mitarbeiter wieder.

Die konzeptionelle Sicht der Metadaten

- informiert über die Konzepte einer Unternehmung, ihre Organisation, ihre Umwelt, ihre Funktionen, ihre internen und externen Schnittstellen,

- dokumentiert die Informationsstrukturen und Informationsflüsse im Unternehmen auf einem hohen logischen Niveau, also unabhängig von Implementierungsaspekten.

Geteilte Benutzerzielgruppe

Die Ziele, die mit der Einführung dieser Ebene verfolgt werden, bestehen zum einen in der grundlegenden Darstellung aller Informationsstrukturen und -flüsse des Unternehmens mit der sich daraus ergebenen Möglichkeit, bestehende Informationsbedürfnisse zu erkennen und zu untersuchen; zum anderen erlaubt das rechnergestützte Instrument "Information Resource Management System" (IRMS) eine unternehmensweite Informationsplanung sowie abhängig von der Realisierung der implementationsbezogenen Ebene Informationssteuerung. Dementsprechend unterscheiden sich die Benutzerzielgruppen der beiden Sichten; die konzeptionelle Sicht wendet sich zur Zeit vor allem an die Systemanalytiker und die Organisatoren, in absehbarer Zukunft auch an das Unternehmensmanagement und an die Mitarbeiter in den Fachabteilungen.

Die Hauptfunktionen, die ein Information Resource Management System leisten soll, können recht gut eingegrenzt werden und sind in unterschiedlichem Umfang in vielen Data-Dictionary-Basissystemen implementiert. Abhängig von den Erfordernissen und den Benutzervorstellungen in einem Unternehmen, gerade auch im Hinblick auf das weitergehende Konzept des Information Resource Management, muß das Anwenderunternehmen viele spezielle Teilfunktionen im Rahmen der aufgeführten Subsysteme selbst realisieren.

Das Manipulationssystem übernimmt dabei die Aufgabe, neue Entities mit ihren beschreibenden Attributen, nach einer Prüfung auf Konsistenz, Vollständigkeit und Kompatibilität, in der Metadatenbasis abzuspeichern, Beziehungen zwischen Entities aufzubauen sowie notwendige Änderungen und Löschungen durchzufahren,

Das Information-Retrieval-Subsystem ermöglicht den lesenden Zugriff auf die Metadaten. Insbesondere soll es unterstützen

- bei der Eingrenzung der jeweils gewünschten Informationen wenn die Primärschlüsselprägungen der gesuchten Entities nicht bekannt sind (Deskriptoren, Ähnlichkeitsanalyse),

- beim Zugriff auf Entities durch Verfolgen von Relationspfaden,

- beim Zugriff auf eine Menge zusammengehörender Entities, die über Relationen miteinander verbunden sind.

Wichtig ist, daß aus Gründen der Benutzerakzeptanz beide bisher genannten Teilsysteme im Dialogbetrieb verfügbar sind.

Userakzeptanz setzt Dialogbetrieb voraus

Das Dokumentationssubsystem dient ausschließlich dazu, meist größere Teile der in der Metadatenbasis abgelegten Metadaten unter verschiedensten Gesichtspunkten aufzubereiten und in Form von Listen und Katalogen auf Papier oder Mikrofilm auszugeben, aber auch einzelne Informationseinheiten als Arbeitsunterlage verfügbar zu machen sowie Berichte und Statistiken, hierbei möglicherweise grafische Darstellungen, zu erstellen.

Um den Nutzen der gespeicherten Metadaten zu erhöhen und um die Steuerungs- und Kontrollfunktion des Information Resource Management Systems realisieren zu können, benötigt man die Subsysteme des "Computer Use Mode". Quelle und Ziel der Metadaten ist der Rechner; das heißt, benachbarte Systeme (zum Beispiel Compiler, Pre-/Postcompiler, Betriebssystem etc.) liefern Metadaten an das Information-Resource-Management-System zur Speicherung in der Metadatenbasis, umgekehrt werden benachbarte Systeme über Schnittstellen mit aufbereiteten Metadaten versorgt.

Die zuerst genannte Aufgabe Übernahme von Metadaten von seiten anderer Systeme und Umsetzen in eine der Metadatenbasis angepaßte Form (Konvertieren) - wird vom Konvertierungssubsystem übernommen. Von Bedeutung ist dieses System besonders beim ersten Einbringen von Entities in die Metadatenbasis, dem "Initial Load", aufgrund der automatischen Auswertung von dem Rechner zugänglichen Informationsquellen, aber auch beim Austausch von Entities zwischen verschiedenen Metadatenbasen im Rahmen des "Distributed Data Processing".

Beim "Initial Load" ergibt sich jedoch das Problem, daß durch bestehende Homonyme und Synonyme bestimmte Beziehungen zwischen Entities in der Metadatenbasis entweder unbeabsichtigt erzeugt (nichterkannte Homonyme) oder aber unbeabsichtigt nicht erzeugt werden (nicht erkannte Synonyme). Trotz des Einsatzes eines solchen Hilfsmittels, zum Beispiel bei der Nachdokumentation existierender EDV-Systeme, wird also manuelle Nacharbeit zur Beseitigung von Redundanzen und Inkonsistenzen in der Metadatenbasis in nicht zu unterschätzendem Umfang erforderlich.

Die umgekehrte Richtung - die Aufbereitung von Metadaten und die Übergabe an andere DV-Systeme wird realisiert durch das Generierungssubsystem, das Laufzeit-Interface oder durch eine Kombination dieser beiden Teilsysteme.

Das Generierungssubsystem hat die Aufgabe, Metadaten in die Form sprachbezogener Statements oder auch Assembler-Makros zu bringen, so daß sie von benachbarten Systemen zur Übersetzungszeit verwandt werden können. Generierungserfordernisse bestehen

- im Bereich Daten hinsichtlich

- programmiersprachenbezogener Daten-, Datei-, Datenbank-, Maskendefinition

PL/ 1 : Declare-Statement,

Cobol : Data Division,

DL/ 1 : PCB, SSA, I/O-Area, IMMSG, OUTMSG etc.,

- systembezogener Datenbank-, Masken-, TP-Netz-Definitionen (Assembler-Makros),

IMS: DBD, PSB,

IMS-MFS: MID/MOD, DIF/DOF,

- GIS DDT,

- NIMS DDT,

- TP-System-Definition für CICS, Shadow etc.,

- im Bereich Prozesse hinsichtlich

- Jobs,

- ICL-Statements,

- Programm-Quelltext,

-Datei-/Datenbankzugriffe,

- Maskeneingaben, sonstige I/O-Moduln,

- Datenprüfroutinen für Konsistenz- und Korrektheitsprüfungen,

- komplette Listenprogramme,

- Entscheidungstabellen etc.

Darüber hinaus kann auch die Generierung von Testdaten in diesem Rahmen berücksichtigt werden.

Die generelle Nutzung des Generierungssubsystems impliziert einen hohen Datendefinitions- und Datennutzungsstandard; gleichzeitig wird die Übereinstimmung der Produktionssysteme und -systemkomponenten mit ihrer Dokumentation weitgehend gewährleistet. Offenbar WE den jedoch Änderungen in der Metadatenbasis regelmäßig erst mit einer gewissen Verzögerung - konkret nach Generierungs-, Übersetzungs- und gegebenenfalls weiteren Verwaltungsläufen - in den Produktionssystemen wirksam. Diese Verzögerung kann, vor allem bei "kleineren" Änderungen (zum Beispiel Erweiterung der Wertebereichsgrenzen eines Entity, Änderung der Eingabeprüfung auf Plausibilität), vermieden werden, wenn die Anwendungssysteme Metadaten über das Laufzeitinterface anfordern und erhalten können, so daß grundsätzlich aktuelle, mit dem Produktionsstatus versehene Metadaten zur Verfügung stehen.

Auch Datenbankmanagementssysteme (DB-System) und Datenkommunikationssystem (DC-System) könnten zur Laufzeit auf eine Reihe von Metadaten wie Datenbankbeschreibung, Zugriffspfadinformationen, Massenstrukturen und sonstige Kontrollinformationen zugreifen, die zur Zeit noch in gesonderten Quelltextbibliotheken und in vorgenerierter Form in Objektmodulbibliotheken - redundant zur Metadatenbasis - untergebracht sind.

In diesem Zusammenhang gibt die nachfolgende Auflistung dem IRMS benachbarter Systeme eine Vorstellung von den umfangreichen, allerdings noch zu realisierenden Möglichkeiten des Metadatenaustauschs über ein Laufzeitinterface:

- eigenständige Systeme:

- Betriebssystem, Utilities

- Magnetbandverwaltungssystem

- Editoren

- Compiler

- DB/DC-Managementsysteme, Utilities

- übrige Anwendungssysteme

- DB-Analyseprozesse

- Statistikprozesse, Monitoren

- Textverarbeitungssystem

- integrierte oder eigenständige Systeme:

- Generatorsysteme

- Information Retrieval Systeme,

- Report Writer Systeme

- Quelltextverwaltungssysteme

- Testdatengeneratoren

- DB-Design-Hilfsmittel

- Methoden- und Modellbanksysteme

Der Laufzeitzugriff von Anwendungssystemen auf die Metadatenbasis ist ein besonders wichtiger Schritt in Richtung Datenunabhängigkeit (Unabhängigkeit der Prozesse von den Daten), da dann Änderungen an Datenelementen und -strukturen, lediglich zentral in das Information-Resource-Management-System eingebracht ohne Neugenerierung/Neuübersetzung gleichzeitig in allen betroffenen Prozessen wirksam werden.

Die dritte Menge von Funktionen eines Information-Resource-Management-Systems wurde unter der Bezeichnung "Supervisor Mode" subsumiert. Sie enthält allein dem Information Resource Manager zur Verfügung stehende Teilsysteme zur Verwaltung und Überwachung des Information-Resource-Management-Systems und der Metadatenbasis.

Das Definitionssubsystem dient der Beschreibung des Metadatenmodells, also der Definition der Datenbankstruktur - der Metadatenbasis. Dieses Subsystem ermöglicht erst die Aufnahme unternehmensspezifischer Informationselemente in das Metadatenmodell.

Das Zugriffskontrollsubsystem ist eine eminent wichtige Komponente eines Information-Resource-Management-Systems, wenngleich keine unmittelbar unter das Bundesdatenschutzgesetz (DBSG) fallenden Daten in der Metadatenbasis gespeichert sind. Dennoch kann die Wirkung nichtautorisierter Zugriffe auf die Metadatenbasis ungleich größer sein als der Zugriff eines Unbefugten auf eine einzelne Datei. Schließlich hat der Betreffende unter Umständen Einblick in den Aufbau der gesamten Unternehmensdatenverarbeitung, erhält gegebenenfalls Informationen über Struktur und Standort aller Unternehmensdaten und über die darauf arbeitenden Prozesse und hat eventuell dadurch auf einfache Art Zugang zur gesamten Informationsressource eines Unternehmens (nicht nur zu personenbezogenen Daten).

Für die Arbeit mit der Metadatenbasis ist insofern eine eher extensive Zugriffskontrolle, bestehend aus Verfahren zur Identifikation, zu verlangen.

Vergleichbar mit den entspechenden Funktionen eines Datenbankmanagementsystems bezeichnet der Term "sonstige Utilities" schließlich grundlegende Verwaltungshilfsmittel für die Metadatenbasis, wie zum Beispiel Auslagern/-laden des Metadatenbestands, Reorganisation, Restrukturierung, Checkpointing, Logging/Recovery/Restart etc.

Problematisch ist es häufig, gegenüber dem Management wie auch gegenüber den Fachabteilungen den Aufwand für die Einführung eines Data-Dictionary-Systems und für den Aufbau eines Information Resource Management zu rechtfertigen, da sowohl Kosten- als auch Nutzenseite schwer zu überschauen und zu qualifizieren sind. Neben den Ausgaben für das zu verwendende Basissystem sind Kostenpositionen für

- die Anpassung und Erweiterung des Basissystems,

- eine Unternehmensinformationsanalyse (Zusammentragen der Metadaten der konzeptionellen Ebene),

- die Nachdokumentation der DV-Systeme (Zusammentragen der Metadaten der implementationsbezogenen Ebene)

anzusetzen, wobei als Voraussetzung für die Systemimplementierung einheitliche Namenskonventionen und Dokumentationsstandards zu schaffen und im Unternehmen durchzusetzen sind.

IRMS-Auswirkungen erst langfristig erkennbar

Außerdem müssen die Investitionen sofort getätigt werden, während die positive Auswirkungen des Information-Resource-Management-Systems

- in seiner Rolle als Informationssystem

* auf die Dokumentation der datenverarbeitenden Systeme durch

- die erstmalige, selbständige Dokumentation aller Systemelemente,

- die Verbesserung und Standardisierung der Dokumentation,

- die Verbesserung des Zugriffs auf die Dokumentation,

- die Sicherstellung der Übereinstimmung der Dokumentation

- Systemwirklichkeit ("Computer Use Mode"),

* auf die Arbeit der EDV-Mitarbeiter durch

- die Verbesserung der Arbeitsqualität (Korrektheit, Vollständigkeit, Sicherheit, Effizienz von Maßnahmen),

- die Verminderung des Aufwands von Maßnahmen,

- die Unterstützung bei der Aufwandsabschätzung von Maßnahmen,

- in seiner Rolle als Systems-Engineering-Tool,

* auf die Entwicklung von EDV-Systemen durch

- die Verbesserung der Designqualität aufgrund der Darstellung der Informationsstrukturen und -flüsse in der konzeptionellen Sicht,

- die Methoden des Softwareengineering,

- die Standardisierung der DV-Systeme ,

- die Unterstützung bei Implementierung, Test und Produktion ("Computer User Mode"),

* und auf die Projektabläufe durch

- projektbegleitende Dokumentation,

- Organisation des Projektablaufs kurzfristig nur in einzelnen abgegrenzten, mit dem System arbeitenden EDV-Entwicklungsprojekten und erst mittel- bis langfristig im gesamten EDV-Bereich wie auch in den Fachabteilungen zu erwarten sind.

Nutzung nur eingeschränkt möglich

Aus Kostengründen ist eine vollständige Nachdokumentation der datenverarbeitenden Systeme auszuschließen, so daß der Metadatenbestand über einen Zeitraum von sicherlich zehn Jahren die Informationsverarbeitung im Unternehmen nur eingeschränkt beschreibt, die Nutzung des Systems gerade im Hinblick auf aktive Informationssteuerung (vergleiche Generierungssubsystem, Laufzeitinterface) nur eingeschränkt möglich ist. Durch

- Einbringen von Teilen der implementationsbezogenen Sicht (vollständige Nachdokumentation der wichtigsten Systeme, Nachdokumentation der Datenbanken und Programme),

- Aufbau der konzeptionellen Sicht zur Ordnung und Darstellung der Begriffswelt des Unternehmens, - automatisches Analysieren und Einbringen der Produktionsabläufe mit ihren Beziehungen und Abhängigkeiten,

- effiziente organisatorische und komfortable technische Einbindung des Systems in die Umgebung der Entwicklungsprojekte

wird es dennoch möglich sein, trotz der Unvollständigkeit des Metadatenbestands das Interesse und die Akzeptanz von

- Systemanalyse sowie, was die konzeptionelle Ebene betrifft, Fachabteilungen,

- Organisationsprogrammierung,

- Systemprogrammierung und Mitarbeitern des Rechenzentrums gegenüber dem Information-Resource-Management-System hochzuhalten.

Die Unterstützung des Unternehmensmanagements aufgrund der Erkenntnis, daß auch und gerade die Arbeit in der EDV-Abteilung organisiert und systematisiert werden muß, ist selbstverständlich Voraussetzung für ein Engagement auf dem Gebiet des Information Resource Management für den Aufbau eines solchen Systems.

* Helmut Schönwald ist Systemanalytiker bei der GEI, Dortmund.