5 Best Practices

So betreiben Sie GenAI in der Cloud

20.10.2023
Von 

David Linthicum ist ein US-amerikanischer Technologieexperte und Buchautor. Zu seinen Schwerpunktthemen gehören unter anderem Cloud Computing, SOA, Enterprise Application Integration und Enterprise Architecture.

Lesen Sie, wie Sie Ihre GenAI-Systeme effektiv in der Cloud betreiben – vom Systemdesign bis hin zur täglichen Performance-Optimierung.
Einfach etwas pushen, weil es angesagt ist und dann hoffen, dass das Ops-Team Design-, Performance- und Stabilitätsprobleme schon lösen wird, ist der falsche Weg hin zu Generative AI in der Cloud.
Einfach etwas pushen, weil es angesagt ist und dann hoffen, dass das Ops-Team Design-, Performance- und Stabilitätsprobleme schon lösen wird, ist der falsche Weg hin zu Generative AI in der Cloud.
Foto: lohloh - shutterstock.com

Viele Cloud-Computing-Konferenzen werden inzwischen zu Generative-AI-Events. Das liegt ganz einfach daran, dass die Cloud-Anbieter in generativer KI eine willkommene Möglichkeit erkannt haben, mehr Cloud-Services zu verkaufen - und diese Rechnung geht in vielen Fällen auf. Schließlich vollzieht sich der Shift hin zu KI-getriebenen Ökosystemen vor allem in Cloud-Computing-Umgebungen. Denn dort sind in der Regel auch State-of-the-Art-GenAI-Systeme, Skalierbarkeit, Accessibility und Kosteneffizienz gegeben.

Das wirft für die Anwender wiederum Fragen auf - insbesondere:

  • Wie können Unternehmen in diesem Umfeld GenAI-Systeme effektiv betreiben?

  • Welche Best Practices gilt es dabei zu berücksichtigen?

Generative KI-Modelle sind Systeme, die - vereinfacht ausgedrückt - Muster und Strukturen aus Input-Daten übernehmen, um neue, originäre Inhalte zu generieren. Das sind die Output-Daten, die strukturiert oder unstrukturiert vorliegen können. Es bestehen dabei wesentliche Unterschiede zu "normalen" KI-Systemen - etwa die Tatsache, dass die Datenverarbeitung in wesentlich höherer Frequenz erfolgt oder dass die Input- und Output-Daten über die Performance bestimmen.

5 Best Practices für cloud-basierte GenAI-Systeme

Weil Operations-Profis gut strukturierte Auflistungen lieben, haben wir im Folgenden fünf Best Practices definiert, wenn es darum geht, Generative-AI-Systeme in der Cloud zu betreiben.

  • Systeme richtig designen. KI- und Cloud-Lösung müssen gemeinsam skalieren und generative KI-Modelle erfordern, dass Speicher- und Rechenressourcen effizient gemanagt werden. Das bedeutet: Ihre Applikationen sollten so gestaltet sein, dass sie die Vorzüge von Cloud-Native-Services bestmöglich nutzen können - das sorgt für Kosteneffizienz und reduziert Komplexität. An dieser Stelle spielt auch die Abstimmung mit dem Dev-Team eine Rolle. Der zugrundeliegende Gedanke: Ist das System von vorneherein richtig konzipiert, bleiben betriebliche Probleme oft aus.

  • Datenqualität sicherstellen. Aussagekräftige KI-Ergebnisse setzen einen qualitativ hochwertigen und entsprechend formatierten Daten-Input voraus. Dabei ist es essenziell, diesen Datenstrom zu managen, zu validieren und abzusichern. Diesen Prozess - inklusive Qualitätschecks, bevor die Daten ins System fließen - zu automatisieren, kann eine erhebliche Zeitersparnis bedeuten. Die meisten Fälle von KI-Halluzinationen sind auf unzureichende oder minderwertige Daten zurückzuführen.

  • Konsequent überprüfen. Generative AI ist kein "Tool", das man einmal konfiguriert und anschließend nie mehr öffnen muss. Die Technologie braucht von Beginn an kontinuierliches Performance-Tuning. Diese dynamische Natur erfordert auch ein konsequentes Monitoring, um sicherstellen zu können, dass die Parameter zu den besten betrieblichen Ergebnissen führen - am besten auf täglicher Basis.

  • Zugangskontrollen einziehen. Weil Ihre generativen KI-Systeme in der Cloud "leben", sind Datenverschlüsselung und regelmäßige Audits aus Sicherheitsperspektive Pflicht. Freunden Sie sich am besten mit den Compliance-Richtlinien an, denn die werden nicht mehr weggehen - und Sie müssen diese automatisieren. Der Grundgedanke dabei: Verlagern Sie so viel Volatilität wie möglich in eine separate Domain, damit die Policies sich um Compliance- und Security-Parameter kümmern.

  • Systemausfälle auffangen können. Nutzungsmuster im Auge zu behalten, regelmäßige Wartungsarbeiten durchzuführen sowie Patches und Updates einzuspielen, ist auch bei GenAI-Systemen in der Cloud Pflicht. Auch an dieser Stelle kann Automatisierung helfen, die Belastung zu verringern und die Effizienz zu steigern. Trotzdem werden Sie wahrscheinlich die Automatisierungssysteme automatisieren müssen, um mit der Anzahl der zu implementierenden Änderungen Schritt halten zu können.

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Infoworld.