Level-up für ChatGPT

Wie Advanced Data Analysis jeden zum Data Scientist macht

03.11.2023
Von 
Maximilian Schwarzmüller, Udemy Instructor des Kurses “ChatGPT - The Complete Guide to ChatGPT & OpenAI APIs”
Mit Advanced Data Analysis besitzt ChatGPT ein Plugin, das nicht nur Phyton Code generiert, sondern auch ausführt. Wie damit Datenanalyse funktioniert und welche Anwendungen möglich sind, lesen Sie hier.
Um ChatGPT und ähnliche KI-Tools richtig nutzen zu können, ist es essenziell zu verstehen, wie sie funktionieren.
Um ChatGPT und ähnliche KI-Tools richtig nutzen zu können, ist es essenziell zu verstehen, wie sie funktionieren.
Foto: SomYuZu - shutterstock.com

ChatGPT und generative KI verändern zunehmend unsere Lebens- und Arbeitswelt und entwickeln sich in rasantem Tempo weiter. Auch die Anwendungsfälle werden immer vielfältiger. Doch um ChatGPT und ähnliche KI-Tools richtig nutzen zu können, ist es essenziell zu verstehen, wie sie funktionieren und wie sie die besten Ergebnisse liefern. Iterative Weiterentwicklungen, wie aktuell ChatGPTs Advanced Data Analysis, können Arbeitnehmer entlasten und sie in die Lage versetzen, auch komplexe Aufgaben einfacher und schneller zu lösen.

ChatGPTs Advanced Data Analysis Plugin wurde erst kürzlich für Plus-Kunden freigegeben und bietet neue Möglichkeiten für Datenanalyse, Bildbearbeitung, Dokumentenauswertung und mehr. Die besondere Eigenschaft dieses zuvor als Code Interpreter bezeichneten Tools ist die Möglichkeit, Python Code von ChatGPT nicht nur generieren, sondern auch ausführen zu lassen. Schon ohne Advanced Data Analysis konnten Nutzer ChatGPT anweisen, Ihnen für bestimmte Aufgaben Python Code zu generieren ­- beispielsweise zur Auswertung einer .csv Datei. Das Problem dabei war, dass ohne Programmierkenntnisse mögliche Fehler im Code nicht erkannt wurden. Das konnte weitreichende Folgen haben: Eine falsche Auswertung beziehungsweise ein falsches Ergebnis oder Fehlermeldungen bei der Anwendung des Codes, die dann mithilfe von ChatGPT analysiert und behoben werden mussten, bis hin zur Löschung von Datensätzen und Dateien.

Wie das Tool Python Code generiert

Advanced Data Analysis minimiert diese Risiken und beseitigt sie teilweise. Nach wie vor ist ein präziser und zielführender Befehl ("Prompt") wichtig, damit die KI die gewünschten Ergebnisse liefert. Jedoch kann ChatGPT mit aktivierter Advanced Data Analysis nun nicht nur Python Code generieren, sondern gleich selbst in einer von OpenAI bereitgestellten isolierten Sandbox-Umgebung ausführen. Diese Umgebung ermöglicht dem Nutzer auch den Upload von Dateien, wie zum Beispiel die auszuwertenden .csv-Dateien. Schlägt das Ausführen des Codes fehl, versucht ChatGPT selbstständig den Code zu verbessern. Und da die Dateien vom Nutzer hochgeladen werden, besteht kein Risiko, Informationen auf der eigenen Festplatte durch fehlerhaften Code zu beschädigen oder gar zu verlieren.

Standardmäßig sieht der Nutzer den generierten Python Code nicht - bei Bedarf kann er jedoch eingesehen werden. Die KI schreibt den Code selbstständig und wendet ihn auf die Daten an. Am Ende hat der Nutzer die geforderte Berechnung und kann sie - nach Wunsch - auch in diversen Diagrammen grafisch darstellen lassen.

Wichtig ist die Einschränkung, dass das Plugin Advanced Data Analysis keinen Internet-Zugriff hat. Dementsprechend kann nur Code generiert und ausgeführt werden, der keinen solchen Zugriff benötigt. Datengewinnung via Web Crawling wäre also beispielsweise nicht möglich.

Zudem unterstützt Advanced Data Analysis aktuell nur die Programmiersprache Python und eine eingeschränkte Liste an populären Packages, also Code-Erweiterungen, die für die Ausführung bestimmter Aufgaben wie zum Beispiel Bilderkennung oder -bearbeitung notwendig sind.

Im Mittelpunkt steht korrektes Prompt Engineering

Um ChatGPT erfolgreich zu nutzen, ist es unabdingbar, die Aufgabenstellung richtig zu formulieren. Je präziser und zielgerichteter der Prompt gestellt wird, desto besser ist das Ergebnis. Welche Technik bei der Erstellung eines Prompts am besten funktioniert, muss jeder Nutzer für sich testen. Durch das Experimentieren mit verschiedenen Prompting-Techniken ("Prompt Engineering") lässt sich herausfinden, welcher Ansatz für welche Problemstellung am geeignetsten ist - das gilt für die Basisversion genauso wie für die Advanced Data Analysis.

Eine sehr wirksame Möglichkeit zur Verbesserung der erzielten Ergebnisse besteht darin, ChatGPT Rückfragen zur Problemstellung stellen zu lassen ("Ask-Before-Answer Prompting"). So kann die KI selbst helfen, einen Prompt zu verfeinern und Fehler zu beheben. Fragen werden besser beantwortet und die Wahrscheinlichkeit für fehlerfreien und zielführenden Code steigt.

ChatGPT erläutert den Lösungsweg Schritt für Schritt

Ein weiterer äußerst hilfreicher Trick ist, ChatGPT um eine Schritt-für-Schritt Erläuterung des Lösungswegs zu bitten. Das zwingt ChatGPT zur detaillierteren Generierung aufeinander aufbauender Sätze und somit auch dazu, bei der Generierung der Antwort mehr Informationen zu berücksichtigen und so präziser zu werden. Zudem wird so das Ergebnis für den Nutzer nachvollziehbarer, es gibt hilfreichen Kontext und Fehlerquellen können besser aufgedeckt werden.

Um die Ergebnisse zu prüfen kann es helfen, der KI Rückfragen zu den von ihr gelieferten Ergebnissen zu stellen ("Self-Evaluative Prompting"). Zudem kann es schon beim Schreiben des Prompts sinnvoll sein, Beispiele zu nennen, die die KI als Grundlage für die Antwortgenerierung nutzen kann ("One-shot" und "Few-shot" Prompting).

Um den vollen Nutzen von generativer KI ausschöpfen zu können, muss die korrekte Anwendung gelernt und trainiert werden. ChatGPT steht hier aktuell sehr im Fokus. Im Vergleich zum ersten Quartal wurden Kurse rund um ChatGPT weltweit um 386 Prozent mehr belegt, allein in Deutschland gab es zum 30. Juni mehr als 31.000 Kurseinschreibungen zum Thema ChatGPT auf der Udemy-Plattform. Aber auch breiter angelegte Kurse zu generativer KI oder spezialisierte Angebote zum Thema Prompt Engineering steigen in der Nachfrage. Insgesamt haben sich auf dem Udemy-Marktplatz und auf Udemy Business bereits über 1,7 Millionen Lernende in ChatGPT-bezogene Kurse eingeschrieben.

Welche Anwendungsfälle gibt es?

ChatGPTs neues Plugin lässt sich auf diversen Wegen nutzen - und da Python Code generiert und ausgeführt wird, sind zumindest theoretisch viele Anwendungsmöglichkeiten denkbar. Einige funktionieren zum jetzigen Stand besser als andere. Besonders relevant ist es, wie der Name Advanced Data Analysis bereits nahelegt, im Bereich der Datenanalyse oder für die Lösung mathematischer Probleme. Aber auch das Auslesen von Dokumenten wie beispielsweise gescannter Belege oder PDFs gelingt oft sehr gut. Eine Nutzung zur Bildbearbeitung ist ebenfalls teilweise möglich, funktioniert aber nur eingeschränkt. Zwar kann ChatGPT Code generieren und ausführen, der Bilder öffnet und editiert, jedoch sind die entsprechenden Möglichkeiten und Fähigkeiten auch aufgrund der bereits genannten Sandbox-Einschränkungen hier noch begrenzt. Allen Anwendungsfällen gemein ist, dass der Nutzer selbst nichts über das Programmieren im Allgemeinen und Python im Speziellen wissen muss. Es muss kein Code selbst erstellt, geprüft und ausgeführt werden.

Datenanalyse erfordert klare Fragestellung

Egal ob der Durchschnittswert eines Sales-Datensatzes über einen gewissen Zeitraum berechnet werden oder die Minimal- und Maximaltemperatur aus einem Wettermodell gefunden werden soll - diese Suche und Analyse kann das Plugin Advanced Data Analysis übernehmen. Regelmäßig kommt ChatGPT dabei auch mit unstrukturierten Daten gut zurecht. Vorausgesetzt, die Anweisungen werden klar genug gegeben: Welche Metriken sollen berechnet werden und welche Spalten oder Zeilen sollen gegebenenfalls ignoriert werden? In welchem Diagramm sollen die Ergebnisse visualisiert werden? Hier ist es wichtig zu bedenken, dass die KI nicht selbständig denken und Rückschlüsse ziehen kann, wie es ein Mensch tun würde. Zwar stellt ChatGPT idealerweise Nachfragen, wenn die Aufgabe zu unklar ist, dennoch besteht das Restrisiko von falschen Ergebnissen, wenn der Faktor Mensch die KI falsch anwendet.

KI löst mathematische Aufgaben

ChatGPT selbst kann nicht rechnen, sondern nur auf Basis eines Prompts eine auf Wahrscheinlichkeiten basierende Vorhersage treffen. Gerade bei komplexen mathematischen Aufgaben sind der KI also Grenzen gesetzt. Mittels Advanced Data Analysis kann ChatGPT jedoch Python Code erstellen, um auch schwierigere Aufgaben zu lösen und so korrekte Ergebnisse zu liefern. Das Erstellen des Codes zur Lösung mathematischer Aufgaben ist für die KI selten ein Problem. Ohne die Advanced Data Analysis kann sie jedoch selbst an einfachen Matheaufgaben scheitern.

Document Parsing

Ein weiterer möglicher Anwendungsfall besteht im Auslesen von Textdokumenten. Sei es eine eingescannte Rechnung oder längere Fachtexte, die miteinander verglichen werden oder aus denen bestimmte Informationen herausgefiltert werden sollen. Hier kann ChatGPT häufig zielführenden Python Code generieren und mittels Advanced Data Analysis auch ausführen.

Eingeschränkte Bildbearbeitung

Im Bereich Bildbearbeitung sind ChatGPTs Fähigkeiten aktuell noch sehr reduziert, da Advanced Data Analysis nur Python unterstützt und die Ausführungsumgebung nur eine von OpenAI vordefinierte Liste an Packages anbietet. Gerade im Bereich der Bildbearbeitung sind solche Packages jedoch regelmäßig notwendig, um die gewünschten Ergebnisse zu erzielen. Zwar ist es theoretisch möglich, auch ohne extra Packages mit Python Code Bilder zu bearbeiten, allerdings überfordert die grundlegende Implementierung einer solchen Lösung nicht nur die meisten Programmierer, sondern auch ChatGPT.

Egal für welchen Anwendungsfall das Plugin genutzt wird - eines bleibt immer wichtig: Der Nutzer muss die Ergebnisse gegenprüfen, um sicherzustellen, dass im Code kein Fehler war. Unsaubere Prompts können zu falschen Ergebnissen führen, ebenso wie Limitierungen aufgrund der Größe der analysierten Datensätze oder Dateien.

Was ist künftig zu erwarten?

Tools wie Advanced Data Analysis werden sich weiterentwickeln. Das kann durch eine Verbesserung der Ausführungsumgebung (sprich: mehr Code Packages, Internet-Zugriff, etc.) geschehen, sowie durch höhere Limits der Datenmengen, die hochgeladen und bearbeitet werden können. Gerade mit einer Anbindung an das Internet könnte ChatGPT nicht nur auf Basis von Trainingsdaten Ergebnisse liefern, sondern auch Quellen angeben und nach aktuellen Daten suchen.

Zudem ließen sich durch die Verknüpfung von Advanced Data Analysis mit weiteren Plugins viele Aufgaben weiter automatisieren. So könnten etwa auf Knopfdruck Auswertungen als formatierte Präsentationen generiert werden - inklusive angepasstem Layout.

Aber auch abseits von ChatGPT und Advanced Data Analysis gibt es rasante Weiterentwicklungen: So findet die Integration von KI in Programme wie Excel, Word, Photoshop und viele andere bereits statt. Auch bei diesen Programmen ist selbstverständlich ein Ausbau der Fähigkeiten zu erwarten. So könnte dann beispielsweise per Knopfdruck eine Analyse von Daten durchgeführt werden, ohne die Datei erst im Browser hochladen zu müssen.

Was wir mit KI in zwei oder fünf Jahren machen können, kann heute niemand genau voraussagen. Sicher ist allerdings, dass künstliche Intelligenz schon heute viele komplexe Aufgaben schnell lösen kann. So verschafft sie Laien und Profis mehr Zeit, sich auf andere Aufgaben zu konzentrieren.

Lesen Sie auch

Die 11 gefragtesten KI-Berufe

Wie Sie Mitarbeiter für KI fit machen

KI ersetzt keine Jobs - aber Menschen ohne KI-Skills