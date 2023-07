KI-Forscher: „Das gegenwärtige ChatGPT ist noch auf Highschool- oder Bachelor-Niveau“

Von: Frank Sieren

Teilen

Wo liegen die Schwächen von ChatGPT? © Christian Ohde/Imago

Hans Uszkoreit, einer der führenden europäischen KI-Forscher und Start-up-Unternehmer, spricht über Europas Chancen bei ChatGPT im Vergleich zu China.

Und warum die Europäer eine große Lücke füllen können und wo die Schwächen von ChatGPT liegen.

Dieses Interview liegt IPPEN.MEDIA im Zuge einer Kooperation mit dem China.Table Professional Briefing vor – zuerst veröffentlicht hatte es China.Table am 27. Juli 2023. Das Gespräch führte Frank Sieren. Dies ist der erste Teil eines zweiteiligen Interviews.

Sie haben gerade ein deutsches ChatGPT-Start-up gegründet, das auch einen Standort in China hat. Worum geht es dabei?

Wir haben das Start-up Nyonic in Berlin gegründet. In Shanghai haben wir ein Forschungsteam. Wir wollen zwei Schwächen von ChatGPT angehen. Die heutigen Sprachmodelle sind zu stark auf das Englische und vielleicht noch auf das Chinesische zentriert. Das wollen wir ändern. Und wir wollen ChatGPT für bestimmte Branchen zu einem verlässlichen Arbeitstool machen, was es heute noch nicht ist.

Newsletter von Table.Media Erhalten Sie 30 Tage kostenlos Zugang zu weiteren exklusiven Informationen der Table.Media Professional Briefings – das Entscheidende für die Entscheidenden in Wirtschaft, Wissenschaft, Politik, Verwaltung und NGOs.

Was fehlt dazu?

ChatGTP muss mir so genaue und aktuelle Antworten geben, dass es zum Beispiel bei der Autoentwicklung und -herstellung helfen kann. Das gegenwärtige ChatGPT ist noch auf Highschool- oder Bachelor-Niveau. Wir müssen es auf das Niveau von Autoingenieuren bekommen. Die Maschine muss eine technische und geschäftliche Verlässlichkeit bekommen, sonst bleibt sie ein Spielzeug.

Aber warum die verschiedenen Sprachen? Englisch ist doch Weltsprache und Chinesisch auf dem Weg dorthin.

Weil viel europäisches Wissen noch gar nicht in Englisch vorliegt, sondern nur in den jeweiligen europäischen Sprachen. Zudem sollen die KI-Systeme für Anwender in aller Welt den gleichen Nutzen bringen. Die Sprachpluralität ist ein Riesenschritt für ChatGPT und wichtig für eine multipolare Welt. Die Mehrheit der Welt ist multilingual. Die USA können es sich leisten, anglozentrische Technologie zu haben. China kann es sich leisten, China-Technologie zu machen. Aber die Mehrheit der Welt, Südostasien, Afrika und eben Europa sind darauf angewiesen, dass viele Sprachen und Kulturen abgedeckt werden.

Warum machen Sie sich die Mühe? Sie sind ja mit 73 Jahren doch schon im Pensionsalter. Sie sind und bleiben ein Pionier der europäischen KI. Sie könnten die Füße hochlegen.

Alle in unserem Team, unabhängig vom Alter, wollen natürlich die größte Revolution in der KI zu unseren Lebzeiten mitgestalten. Hinzu kommt unser Wunsch, dass Europa sich diesmal nicht von den USA und China abhängen lässt. Wir haben sehr viele kluge Leute und viele Innovationen kamen aus Europa. Doch dann haben wir es immer wieder vermasselt. In China gibt es bereits mehr als 80 Sprachmodelle von der Größe von ChatGPT. In der EU gerade mal drei. In Deutschland gibt es erst eines, das bis jetzt auch noch nicht zu den besten zählt. Das wollen wir ändern.

Und die Chinesen, die daran mitarbeiten?

Die meisten sind, wie unser CEO Dong Han, zwei- oder mehrsprachig und haben deshalb schon aus biografischen Gründen ein Interesse an vielsprachiger KI. Fast alle chinesischen Modelle sind nur für den Einsatz in China konzipiert. Unsere Experten haben zum Teil in Deutschland oder anderen europäischen Ländern studiert und dort multilinguale Sprachtechnologie kennengelernt. Aber wir haben zum Beispiel auch Top-Ingenieure von Google abgeworben, weil sie unser Projekt mitgestalten wollen.

Das Thema künstliche Intelligenz ist ja nicht neu. Sie beschäftigen sich seit mehr als 30 Jahren damit. Was ist denn neu mit ChatGPT, dass es nun die große Aufregung gibt?

Das System hat nun etwas erreicht, was wir beim Menschen Verständnis nennen. Es ist zwar bei der Maschine anders definiert, denn die Maschine hat nicht unser holistisches Weltbild und passt auch ihr Wissen nicht an Aussagen der Benutzer an. Aber die Wirkung ist die gleiche: Die Maschine benimmt sich in ihren Antworten so, als würde sie die Eingaben tatsächlich verstehen.

Aber das war doch früher schon so.

Ja und nein. Es gab ein System, das konnte Schach spielen, ein anderes kann autonomes Fahren, noch ein anderes kann Bedarfsvorausplanung und Berechnung. Ein anderes kann übersetzen oder Musik schreiben und so weiter. Jedes System muss mit den Daten dieses Bereiches trainiert werden. Es lernt auch an hunderttausenden, manchmal Millionen Beispielen, wie es sich verhalten soll. Das funktioniert ein wenig wie bei einem Hund, dem ich etwas zu essen gebe. Bei dem, was er fressen soll, wird er belohnt. Bei dem, was er nicht fressen soll, gibt es einen Klaps auf die Pfoten. Der Hund hat das irgendwann gelernt, ohne zu wissen, was Fleisch, Kuchen oder Knochen sind …

… hat aber immer nur kleine triviale Aufgaben bewältigt.

Das ist beim bisherigen Machine Learning nicht viel anders. Für die Sprach-KI bedeutet das: Sie hat viele einzelne Fakten, Wörter und Begriffe gelernt. Nun, mit der Transformer-Technologie, auf der die neue KI basiert, ist sie besser in der Lage, Kontexte zu erfassen und aus denen wirkliche Bedeutung zu lernen. Das ist, als ob man in einer dunklen Hütte ohne Fenster aus Tausenden von Büchern und dem Internet lernt, was da draußen los ist. Am Anfang lernt man nur Begriffe wie Sonne, Baum, Blumen oder Auto. Mit der Zeit hat man so viele Informationen, dass man die Welt da draußen immer genauer nachzeichnen kann. Die Sonne geht auf und unter. Es können Wolken davor sein, und die werfen Schatten. Und manche Blumen richten sich nach der Sonne aus. Die Transformer-Technologie hat dann gelernt, sich nun in dieser Welt gewissermaßen zu bewegen, die immer mehr so aussieht wie unsere Welt, die aber nicht unsere Welt ist. Dadurch kann die Maschine inzwischen in dieser Welt Aufgaben lösen, für die sie nie trainiert wurde. Das ist der große Schritt der Transformer-Technologie, auf der ChatGPT basiert, wie der Name schon sagt: Generative Pretrained Transformer.

Können Sie das an einem Beispiel erklären?

Ich kann sagen: Fasse mir einen Text über die Funktionen des Autos so zusammen, dass es ein Zehnjähriger versteht. Die Maschine hat das noch nie gemacht. Aber sie weiß, was Texte zusammenfassen bedeutet und sie hat verstanden, dass Zehnjährige eine andere Sprache sprechen als 40-Jährige. Die Maschine hat schon viele Texte für 10-Jährige verfasst. Sie hat Schritt für Schritt gelernt, wie sie die Sätze bilden, welche Worte sie benutzen soll und welche zu schwierig sind. Also macht sie das so, durch Worte, die Zehnjährige benutzen, um zu beschreiben, wie ein Auto funktioniert.

Das fällt sogar dem Durchschnitts-Erwachsenen schwer.

Ja, obwohl er sofort versteht, was ein Auto ist und die Maschinen sich dem Bild des Autos in vielen kleinen Schritten nur angenähert haben. Das ist das Wunder: Die Maschine bekommt das hin, obwohl sie im Grunde nur stupide Texte gelernt hat. Sie hat Wörter gelernt, dann auch Wortgruppen und ganze Sätzen, dann ganze Textstücke, mit denen wir Menschen sie füttern. Und immer im Kontext, sodass sie nun aus den Wörtern und Wortgruppen völlig neue sinnvolle Texte, auch anspruchsvolle, entwerfen kann.

Das bedeutet, Fortschritte erzielt man inzwischen durch das Training der Sprachmodelle und nicht mehr durch Algorithmen.

Absolut. Die jüngsten Fortschritte kamen durch die Daten und das Training, nicht durch neue Algorithmen. Google und Baidu setzen zum Teil komplexere Algorithmen ein als OpenAI. Das versuche ich der Politik immer wieder zu erklären. Die ermahnen uns ja dauernd: Wir sollen die Algorithmen genauer programmieren, damit sich keine „falsche“ Meinung mehr bildet. Das liegt jedoch nicht an den Algorithmen. Die Maschine muss mit der Vielseitigkeit und Widersprüchlichkeit dessen, was sie aus der Fülle der Textdaten gelernt hat, umgehen. Dabei kommt sie mitunter zu anderen Ergebnissen als sich manche wünschen. Und oft sind sie realitätsnäher als das, was sich mancher so wünscht und deswegen die Realität für falsch hält. Es geht nun um die Textmenge, das Mischungsverhältnis und die Art, wie ich das System trainiere, aber nicht mehr um die Algorithmen.

Wo liegen denn noch die Schwächen von ChatGPT?

ChatGPT ist zwar superschlau, hat aber auch erstaunliche Wissenslücken, die es manchmal durch Fantasie ausfüllt. Man kann sich noch nicht voll auf seine Kenntnisse und sein Urteil verlassen.

In der nächsten Version wird das doch sicher behoben?

Das wird Sie überraschen: Es gibt leider noch keine verlässliche Methode, nach der ich die Maschine ausbilden kann, um das zu bekommen, was ich möchte. Das ist alles noch Trial-and-Error. Mehr eine Kunst als eine Wissenschaft. Es gibt kein Curriculum, sondern ich füttere einfach Daten in Riesenschläuche ein und warte was passiert. Wir wissen nicht wirklich, was die Maschine dabei macht. Wenn das Ergebnis kommt, sagen wir: Schön gelernt, aber liebe Maschine, du sollst nicht alles glauben, was du gelesen hast. Und sag nicht alles, was du glaubst. Dann füttern wir gezielt Daten, um das Verhalten der Maschine zu korrigieren oder zu verbessern und schauen wieder, was herauskommt.

Geht das so einfach?

Die Maschine zu trainieren, mit Daten zu füttern, ist verdammt teuer. Das kostet jeweils viele Millionen. Deshalb können wir nicht einfach mal zehn Varianten ausprobieren. Das bedeutet, ich weiß gar nicht, wie gut meine Methode wirklich ist, weil ich nur relativ wenig Vergleiche habe.

Es kann also sein, dass wir die ganze Zeit einen verschlungenen Pfad bergauf gehen, weil wir die Seilbahn nicht finden.

Ja, und dieses Herumstochern ist für jemanden, der nach verlässlichen, immer besseren Methoden sucht, nicht so einfach zu akzeptieren. Das, was wir machen, ist teilweise noch Alchemie. Ich rühre den Zaubertrank zusammen. Der Zaubertrank wirkt. Ich kann dieses Wissen auch weitergeben. Ich weiß aber nicht warum, sondern nur wie er wirkt. Und die Nebenwirkungen kenne ich nur zum Teil. Gleichzeitig reden wir über Maschinen, die eine Anwaltsprüfung bestehen und als zugelassene Anwälte arbeiten könnten.

Was hat sie am meisten überrascht an der gegenwärtigen Entwicklung?

Viele meiner Kollegen und ich waren überzeugt, dass auch das Transformer-Modell schrittweise wie der Mensch lernen muss und sich langsam durch immer mehr und bessere Lerndaten verbessern würde. Wir waren schon verblüfft, als Forscher mit Brute Force mehr als 100 Milliarden Parameter angesetzt und die Maschine mit Hunderten von Milliarden Wörtern gefüttert haben. Das System ist nicht, wie wir befürchtet haben, einfach zusammengebrochen oder hat nur noch Unsinn produziert. Da waren wir alle Baff.

Die Maschine ist vielmehr schon so mächtig, dass sie auch sehr lange Texte in einem Schritt verarbeiten kann. Und auch muss. Das ist ganz anders als beim Menschen, der einen Text inkrementell Wort für Wort und Satz für Satz verarbeitet und in der Mitte eines Satzes bereits oft vorhersagen kann, wie es weitergeht.

Hans Uszkoreit, 73, hat in Deutschland, aber auch lange in den USA und in China gearbeitet – als Universitätsprofessor, Forschungsmanager, Industrieberater und Mitgründer mehrerer Startups. Er gilt als einer der führenden europäischen KI-Forscher. Uszkoreit ist wissenschaftlicher Direktor am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI).Er hat deutsche und internationale Forschungsverbünde initiiert und koordiniert, leitete mehrere der bekanntesten europäischen Projekte. Uszkoreit ist Autor von über 250 internationalen Publikationen. Jüngst hat er das Berliner ChatGPT-ähnliche Startup „nyonic“ gegründet – zusammen mit einem Forschungsteam in Shanghai.

Uszkoreit hat einen starken Bezug zu China: Er war Chief Scientist des Artificial Intelligence Technology Center (AITC) in Beijing. Seine Gattin, Xu Feiyu, ist ebenfalls profilierte KI-Forscherin und war zuletzt KI-Chefin von SAP.