Applikationen an veränderte Situationen anpassen:Flexible Kommunikation ist ein "Muß"

08.11.1985

Die jüngsten Fortschritte bei den Sprachen der vierten Generation haben - zusammen mit einem besseren Management und größeren Budgets - dazu beigetragen, die Situation der Datenverarbeitung zu stabilisieren. Es gibt jedoch viele enttäuschte Benutzer, die heute um die Datenverarbeitung einen großen Bogen schlagen.

In vielen Fällen führt dieses fast verzweifelte Vorgehen zu Konflikten innerhalb des gesamten Unternehmens. Die unterschiedlichsten Gruppen kämpfen um die Kontrolle der DV-Ressourcen; unglücklicherweise kommt dadurch jeder mögliche Fortschritt zum Erliegen.

Um den Einsatz dieser Ressourcen optimal zu gestalten, muß man erkennen, daß sowohl der Endbenutzer als auch die Datenverarbeitung bestimmte Stärken und Schwächen aufweisen. Will man einen Dienstleistungsbereich "Informationen" für das gesamte Unternehmen aufbauen, dann müssen sich Endbenutzer und Datenverarbeitung ergänzen und gegenseitig unterstützen. Es ist daher von grundlegender Bedeutung, daß jedes Unternehmen die Bedeutung des Aktivpostens "Informationen" erkennt.

Die Datenverarbeitung wird in der ihr zustehenden neuen Funktion die Belegschaft nicht einfach nur unterstützen, sondern alle Unternehmensbereiche erfassen. Herkömmliche Datenbanken sowie Prozesse, die heute noch auf Großrechnern ablaufen, stehen dann innerhalb des gesamten Unternehmens in verteilter Form zur Verfügung. Batch-Prozesse werden mehr und mehr auf Online Betrieb umgestellt und Datennetzwerke mit NF/HF-Netzwerken gekoppelt, um die Übertragungskosten zu senken.

Information gilt selten als Aktivposten

Die meisten Unternehmen bemühen sich deshalb intensiv darum ihre vorhandenen Anwendungen so anzupassen, daß sie Systeme mit niedrigeren Kosten und gleichzeitig höherer Leistung einsetzen können. So nimmt man heute beispielsweise an, daß die Kosten eines Fünf-Mips-Prozessors von heute zwei Millionen US-Dollar bis spätestens 1990 auf 360 000 US-Dollar sinken. In der gleichen Zeit sollen die Kosten eines 1-MB-Speichers von 10 000 US-Dollar auf 160 US-Dollar fallen.

Die neuen Systeme müssen die Übertragung und Verarbeitung von Daten durch unterschiedliche Rechner zulassen, die sich auf allen Unternehmensebenen befinden. Diese Flexibilität sorgt für eine Minimierung der Kosten in der Datenverarbeitung und den hohen Grad an Reaktionsgeschwindigkeit, der von dynamischen Unternehmen heute verlangt wird.

Die Hersteller haben allerdings häufig ihre Systeme nicht so konstruiert, daß dieser Grad der Flexibilität vorhanden ist.

Sobald Unternehmen auf verteilte Systeme umsteigen, die unweigerlich Komponenten von verschiedenen Herstellern enthalten, wird das Kompatibilitätsproblem akut.

Schließt man auch noch Mikros an das Netzwerk an, erhöht sich die Vielfalt noch weiter, da zahlreiche Hersteller "Workstations" für den Bürobetrieb sowie den professionellen Betrieb anbieten. Jedes Gerät hat sein eigenes internes Programmkonzept und eigene Dateiformate; viele Geräte unterstützen ein oder mehrere Kommunikationsprotokolle. In dieser Weise entstehen Mixed-Mode-Netzwerke mit Großrechnern, Minis und Mikros entstehen, die auf der untersten Ebene Nachrichten austauschen können. An den jeweiligen Enden gibt es jedoch keine Logikteile, die die Bedeutung dieser Nachrichten interpretieren.

Das OSI-Modell (Open System Connection), das von der ISO festgelegt worden ist, bietet einen Rahmen zur Lösung dieser Probleme. Zwar unterscheiden sich die Implementierungen der einzelnen Hersteller, doch das Modell begünstigt eine verbesserte Anschlußmöglichkeit.

Das bekannteste Beispiel für ein Netz ist das SNA (System Network Architecture) von IBM. Innerhalb der IBM-Welt benutzen etwa ein Drittel aller Allzweck-Rechner sowie zwei Drittel der großen Rechner 30XX SNA. IBM implementiert die unteren und mittleren Ebenen des SNA mit einer Kombination aus Hardware, Firmware sowie Zugriffs-Software.

Auf den obersten Ebenen gibt es keine Normen. IBM verfügt über eine Reihe von Betriebssystemen und Programmen wie zum Beispiel IMS, CICS oder JES. Eine Kommunikation zwischen Datenbank-Systemen oder Anwendungsprogrammen verschiedener Hersteller ist jedoch äußerst schwierig. Innerhalb der nächsten zehn Jahre werden die beiden obersten Ebenen immer komplexer werden. Schon die Präsentationsebene sowie die Anwendungsebene unterteilen sich in die Unterebenen "Basis ", "Dienstprogramme " und "Anwendungen".

Interfaces zu Systemen der ersten Generation fehlen

Zu den weiteren Entwicklungen zählen relationale DBMS, getrennte Netzwerk-Kontrolle, aktive "Directory"-Kontrolle, "Query" und Anwendungs-Entwicklungssysteme der vierten Generation. Die vom Benutzer geschriebene Anwendungslogik nimmt ab, da die neuen Tools viele der Funktionen bereitstellen, die vorher in jedem Anwendungsprogramm enthalten waren.

Textverarbeitung zählt zu den Bereichen, die eine Vereinfachung fordern, damit Dokumente leichter ausgetauscht werden können.

Die meisten neuen entscheidungsunterstützenden Tools sowie die Anwendungs-Entwicklungs-Systeme sind isoliert entwickelt worden und haben kein Interface zwischen den DB/DC-Systemen der ersten Generation. Dadurch bleibt eine Lücke zwischen den operationellen Systemen, die in den letzten 20 Jahren entwickelt worden sind, und den neuen taktischen und strategischen Systemen. Diese Lücke verursacht Redundanz bei der Datenübertragung sowie bei, der Pflege der Konsistenz zwischen unterschiedlichen Systemen. Die Systeme müssen besser und flexibler miteinander kommunizieren, um die neuen Geschäftsumgebungen zu unterstützen.

Datenaufbereitung schafft immer noch Probleme

Die bereits erwähnte Kommunikationsnorm sollte verbessert werden, damit eine vollständige Netzwerkverwaltung möglich ist. Die Anwendungsprogramme müssen von den Einzelheiten der Kommunikationsprotokolle, den Datenstrukturen und dem Ort getrennt werden. Diese Systeme enthalten dann ein "Inline Directory", das die Systemsoftware während der Ausführung überwacht. Die neue "Enzyklopädie" oder die "konzeptionellen Schemata" der Speicherung steuern schließlich die Anwendungsentwicklungs-Systeme der vierten Generation.

Im Bereich der Datenbanken müssen die Programme von den physikalischen Datenstrukturen isoliert werden. Die Datenbank-Systeme der ersten Generation, ob sie hierarchisch, Netzwerk- oder inverted-file-orientiert sind, kombinierten eine Vielzahl von getrennten Dateien zu einer einzigen verknüpften Struktur. Eine Vielzahl von Programmen ist heute dazu in der Lage, die Daten miteinander zu teilen, indem sie eine gemeinsame Datenbank benutzen. Diese Methode erlaubt zwar die gemeinsame Nutzung eines einheitlichen, zentralisierten Satzes von Daten, jedoch sind die Anwendungen immer noch von der Datenstruktur und dem Ort abhängig .

Die relationalen Systeme lösen dieses Problem, indem sie die Steuerung aus der Programmlogik herausnehmen und in den Datenbank-Manager setzen. Da die gegenwärtigen relationalen Systeme noch Plattenspeicher verwenden, müssen sie eine Kombination aus Indexzeichen, "Pointers" und Ketten verwenden, um in effizienter Weise Zugriff auf die Daten zu haben und die Daten zu verknüpfen. Die physikalische Struktur ist jedoch vom Programm getrennt, das nur seine eigene logische Sicht der Daten sieht.

In der Theorie wären die relationalen Systeme besser mit einem inhaltsadressierbaren oder assoziativen Speicher zu implementieren, der die Daten ohne irgendwelche "Pointers", Indexzeichen oder Ketten speichert. Die Hardware müßte dann so konstruiert sein, daß der Datenzugriff mit einem parallelen Suchvorhang durchgeführt wird; Daten würden dann nach der vom Programm geforderten Sicht gehandhabt.

Diese "rein relationalen" Systeme sind die Systeme, die sich in Zukunft durchsetzen könnten. Sie sind heute jedoch noch nicht in der Praxis für große Produktions-Datenbanken einsetzbar, da sie große Festspeicher und spezielle Rechner benötigen. Ein Kostenvergleich zwischen Festspeichern und Plattenspeichern ergibt einen Vorteil von 1000 zu 1 für große Plattenspeicher. Doch selbst bei einem erwarteten Preisverfall werden die Festspeicher noch nicht konkurrenzfähig zu den großen Plattenspeichern sein. In der gleichen Zeit ergeben sich parallel allmählich Verbesserungen bei der Plattenspeichersteuerung und der Maschinenarchitektur der Datenbanken.

Das Problem heute besteht darin, den Übergang von Standard-Dateisystemen und strukturierten Datenbank-Systemen der ersten Generation auf "rein relationale" Systeme der Zukunft zu vollziehen.

Die meisten vorhandenen Teil-relationalen Systeme wie SQL/DS und DB2 von IBM erfordern eine Duplizierung der Daten. Diese duplizierten Daten werden auf Platten gespeichert und von der Software verwaltet. Diese relationalen Systeme finden daher ihre Grenze durch die gleiche Basistechnologie, wie die Systeme, die sie duplizieren. Als Resultat ergeben sich geringfügige Verbesserungen unter großen Ausgaben für Rechner und Personal. Außerdem wird die Aufrechterhaltung der Konsistenz ein Problem, sobald die Daten aktualisiert werden.

Solange die Hardware noch nicht verfügbar ist, um "rein relationale" Systeme in der Praxis einsetzen zu können, besteht die bessere Lösung darin, keine redundanten Daten zu benötigen. Statt dessen erfolgt der Zugriff auf die vorhandenen Dateistrukturen durch den Datenbank-Manager, und die Ergebnisse werden dem Programmierer oder Endbenutzer als relationale Sicht vorgelegt.

Die Steuerung und Verwaltung der Daten überwacht ein "Inline Directory". Dieses "Directory" enthält Beschreibungen der logischen und physikalischen Sichten sowie Beschreibungen, wie die beiden aufeinander abgebildet werden. Das Directory kann durch die DBA-Funktion unter Einsatz von neuen Online-Sprachen verwaltet werden und so die Gesamtproduktivität steigern. Diese Technik ist nicht so automatisiert wie die Technik der Datenduplizierung, doch sie ist flexibler, da sowohl nicht-normalisierte als auch normalisierte Daten verarbeitet werden können. Diese Technik bietet obendrein eine höhere Leistung, da nur eine Datenkopie verwaltet werden muß, die System-Gemeinkosten damit verringert und die Steuerungsstrategien von DBA optimiert werden können.

Die Methode der logischen Benutzersicht bietet Programmierern und Endbenutzern die Vorteile eines relationalen Systems, erlaubt den Datenbank-Operatoren, ungleiche Systeme zu integrieren, und macht es dem DV-Manager möglich, auf die neue Technologie umzurüsten, sobald diese in der Praxis einsetzbar ist.

Die logische Sicht sorgt zwar für eine Insolierung von den Datenestrukturen, macht aber das Programm noch nicht allein unabhängig vom Standort der Daten. Um auf Daten in verschiedenen Umgebungen zugreifen zu können (entweder innerhalb eines Rechners oder in verschiedenen Rechnern am gleichen ortsfernen Standort), sind noch weitere Funktionen erforderlich. Diese Funktionen werden durch einen erweiterten physikalischen Datenbank-Manager, einen erweiterten TP-Monitor, eine neue Netzwerk-Kontrollfunktion und das "Inline Directory" bereitgestellt.

Die Probleme fangen bereits innerhalb eines Rechners an, da einige Systeme innerhalb desselben Rechners unterschiedliche Datenformate für getrennte Umgebungen haben. Es ist zum Beispiel in einer IBM-Umgebung schwierig, Daten zu lesen und zu aktualisieren, die aus Batch-, CICS und CMS-Umgebungen kommen.

Die erste Phase einer leistungsfähigen Kommunikation sollte darin bestehen, eine flexible Kommunikation innerhalb einer Maschine zu unterstützen, so daß unterschiedliche Umgebungen eine gemeinsame Datenbank nutzen können.

Angesichts der steigenden Kommunikationskosten und der sinkenden Verarbeitungskosten verteilen User die Datenverarbeitung oft auf verschiedene Rechner. Die heute gebräuchlichen TP-Monitore sind für "single-mode" Mehr-Terminal-Systeme entwickelt worden. Sobald das Kommunikationssystem einen gewissen Komplexitätsgrad erreicht hat, sollte die Netzwerksteuerung von den anderen TP-Monitorfunktionen getrennt behandelt sein.

Zu den Netzwerk-Steuerungsfunktionen zählen die Kommunikation zwischen Monitoren verschiedenen Typs in einem oder mehreren Rechnern, dynamische Netzwerkkonfiguration, Aufspüren von Netzwerkfehlern, Diagnose- und Warnungsmeldungen sowie weitere Netzwerk-Mansgementfunktionen. Mit diesem Support können auch Datei- oder Nachrichtenübertragungen zwischen Systemen vorgenommen werden. Das Ganze bildet jedoch noch keine vollständig verteilte Datenbank, da die Verwaltung ortsferner Daten noch durch die Anwendungen gesteuert wird.

System verwaltet gemeinsame Ressourcen

In der Endstufe erfolgt die Verteilung von Daten und Datenverarbeitung an mehrere Rechner. Das System - und nicht die Anwendungen - verwaltet die gemeinsame Nutzung der Ressourcen. Die Anwendungsprogramme sind dann sowohl von der Datenstruktur als auch vom Standort der Daten getrennt. Somit merkt der Benutzer nicht, ob seine Anforderung am Ort oder ortsfern verarbeitet wird. Den Systemverwaltern stehen Tools zur Verfügung, mit denen sie Hardware- und Software-Ressourcen an mehreren Orten überwachen, abstimmen, wiederherstellen und verwalten können.

Klaus Amann ist Geschäftsführer der Cincom Systems GmbH & Co. OHG, Frankfurt.

Dieser Beitrag wurde entnommen aus dem Softwaremarkt 19/85 vom 18. September 1985.