Automatische Texterstellung revolutioniert seit Jahren die Content-Erstellung in vielen Bereichen: Nachrichten-Portale setzen zunehmend auf Roboterjournalismus, Online-Shops nutzen computergenerierte Texte für Produktbeschreibungen und Smarte Anwendungen kreieren automatisch individuelle Reports wie Geschäftsberichte, Immobilien-Exposés oder Fondsreports.

In puncto Qualität lässt sich bei vielen Meldungen kaum ein Unterschied zwischen automatisch erstellten Beiträgen und denen menschlicher Texter feststellen. Tests mit Fußball-Spielberichten ergaben, dass Leser die Erzeugnisse des Robotertexters natürlicher empfanden als die Beiträge eines echten Reporters. Natural Language Generation (NLG) ist der Oberbegriff dieser Anwendungen, die vor allem auf einer leistungsstarken KI mit massiven Deep-Learning-Funktionen basiert.

Bislang nur drei Basistechnologien

Nahezu alle Enterprise-KI-Systeme bieten schon seit einigen Jahren NLG-Funktionen an. Dadurch ist die Zahl der NLG-Anbieter zwar gestiegen, doch deren Systeme basieren alle nur auf drei Basistechnologien: GPT-3, eine von OpenAI entwickelte Open Source Lösung, dem "Switch Transformer" von Google und "Megatron-Turing" ein Gemeinschaftsprojekt von Microsoft und Nvidia. Anwendungsseitig ist NLG im englischsprachigen Raum am weitesten verbreitet - folglich sind auch die meisten Programme für diese Sprache optimiert.

NLG für Chinesisch mit 245,7 Mrd. Parametern

Aktuell zieht jetzt ein neues Sprachmodell die Aufmerksamkeit der KI-Welt auf sich: Yuan 1.0. Das Modell wurde am 28. September 2021 vom Inspur Artificial Intelligence Research Institute vorgestellt. Das Besondere daran ist, dass es Texte in der hochkomplexen chinesischen Sprache erzeugt, was im Vergleich zu Englisch einen völlig neuen Entwicklungsansatz erfordert. Dabei mag ein NLG-System für Chinesisch vordergründig sehr exotisch klingen, doch Mandarin-Chinesisch ist laut SIL Internationaldie weltweit am meisten gesprochene Muttersprache.

Benchmark beweist die Leistungsfähigkeit

Die Mächtigkeit eines Sprachmodells misst sich an der Zahl der verwendeten Parameter. Mit 245,7 Milliarden Parametern ist Yuan 1.0 eines der größten Sprachmodelle der Welt. Und es zeigte schon bei der Vorstellung eine beeindruckende Leistung, da die automatisch erzeugten Texte kaum von menschengenerierten Texten zu unterscheiden waren. Auch beim "Chinese Language Understanding Evaluation" Benchmark (CLUE) erreichte Yuan sowohl bei Zero-CLUE als auch bei Few-CLUE den ersten Platz. Bemerkenswerterweise übertraf Yuan sogar die menschlichen Fähigkeiten beim Verstehen von Redewendungen.

Aus 866 TB Rohdaten wurde ein Dataset von 5 TB

Das Trainieren von großen generative Sprachmodellen, ist aus mehreren Gründen eine Herausforderung. Zum einen ist es kaum noch möglich, alle Parameter im Arbeitsspeicher der GPUs zu laden, zum anderen kann das Training aufgrund der vielen rechenintensiven Operationen sehr lange dauern. Inspur musste deshalb verschiedene neue Technologien erstellen. Für die Datenbereinigung und -Filterung wurde ein "Massive Data Filtering System" (MDFS) entwickelt, das auf Spark aufbaut. MDFS besteht aus den Phasen Datenerfassung, Filterung und Feinabstimmung. Zu MDFS gehört ein fünf Terabyte Dataset, in dem das Ergebnis der Filterung von 866 TB Rohdaten enthalten ist, die aus dem Internet gewonnen wurden. Hierzu wurde MDFS auf einem On-Premise-Hochleistungscluster mit 36 ??Knoten betrieben. Jeder Knoten war mit Intel-CPUs mit 128 Kernen und 512 GB Speicher bestückt.

Für die immense Rechenarbeit wurde ein groß angelegtes verteiltes Trainingssystem auf Basis von 2.128 NVidia A100 GPUs entwickelt. Es kombiniert drei verschiedene Strategien der Parallelverarbeitung: Tensor-, Pipeline- und Daten-Parallelität. Vor dem Training wurde eine Analyse über den voraussichtlichen Zeitaufwand für die Berechnungen und Interaktionen der verschiedenen Parallelitäten durchgeführt. Entsprechend den Ergebnissen konnte dann die Nutzung der verschiedenen Parallelitäten optimiert werden. Dieses Vorgehen ermöglichte die Berechnung von 245,7 Milliarden Parametern mit einer Rechenleistung von 4095 Peta-Flop-Tagen bei einem Trainingsverlust von nur 1,64.

Sprachmodellierung als KI-Treiber

Inspurs Artificial Intelligence Research Institute konzentriert sich auf den Ausbau von Innovationen bei KI-Spitzentechnologien. Seit seiner Gründung hat es zahlreiche Errungenschaften bei der Erforschung kognitiver Intelligenz und KI-Anwendungen erzielt. In diesem Kontext sieht Inspur auch die Entwicklung von Yuan 1.0, denn NLG-Programme sind die Speerspitze moderner KI-Anwendungen. Die Entwicklung solcher Systeme hat großen Einfluss auf die gesamte KI-Szene und strahlt damit auf die Weiterentwicklung von vielen komplexen Digitalisierungen in der Businesswelt, aber auch bei Enduser-Anwendungen, wie Metaverse, aus. Beispielsweise verbessert das Lösen von umfangreichen Modell- und Datenproblemen, die Transformation der Wahrnehmungsintelligenz hin zu einer kognitiven Intelligenz. Das würde dann den Aufbau und das Verständnis von Smart-Cities deutlich erleichtern, da sich so digitalen Zwillingsstädte erstellen ließen.

