In diesem Blog setze ich mich mit ChatGPT auseinander und wo die KI ihre Grenzen hat.
Trotz aller Weiterentwicklung der Künstlichen Intelligenz (KI), wird sie die menschliche Kommunikation nur sehr begrenzt abbilden können.
Ich halte die momentane Hype über ChatGPT für übertrieben. Die aktuellen Erfahrungen zeigen den Unsinn, den ChatGPT in der Kommunikation erzeugen kann. Dieser Unsinn mag durch Optimierung der Algorithmen zukünftig vermieden werden. Was mathematische Modell jedoch bei aller Optimierung nicht können, ist die dynamische Komplexität und Vielfalt zwischenmenschlicher Kommunikation zu erfassen oder zu ersetzen.
In diesem Blog beschäftige ich mich mit folgenden Fragen:
Was ist ChatGPT und wie funktioniert es?
Was ist menschliche Kommunikation und warum kann ChatGPT (KI) diese nur sehr begrenzt abbilden?
Was ist ChatGPT und wie funktioniert der Chatbot?
Der Name steht für „Chat Generative Pre-trained Transformer“, den OpenAI Ende November veröffentlichte. Der Chatbot basiert auf einem Maschinenlernmodell, das menschliche Eingaben anscheinend versteht und auf angeblich auf natürlich klingende Weise beantwortet. Der Chatbot kann Gedichte schreiben, Texte zusammenfassen oder sogar programmieren.
Zur Optimierung des KI werden Sprachmodelle genutzt. Das Training und die Optimierung von ChatGPT werden 1,75 Milliarden Parameter genutzt. Die Optimierungsprozesse werden durch eine sogenanntes Superwise-Verfahren der KI gesteuert. Menschen optimieren durch die Feinsteuerung der Algorithmen das Sprachmodell von ChatGPT.
Das geschieht grob gesagt in drei Schritten:
- Sammeln von Beispieldaten der Kommunikation und Überwachung durch den Menschen
- Trainieren des mathematischen Modells, wobei Menschen die Ergebnisse von den Besten zu den Schlechtesten zuordnen. Diese Ergebnisse werden dann genutzt, um das mathematische Sprachmodell weiter zu verfeinern und zu verbessern.
- Es wird daraus ein mathematisches Überwachungsmodell gewonnen, dass die Ausgabeergebnisse verstärkt, die aufgrund von Wahrscheinlichkeitsberechnungen dem besten Sprachergebnis am nächsten kommt.
Der Fortschritt des KI Konzepts von ChatGPT besteht darin, dass die trainierten und optimierten Antwortmöglichkeiten des Chats nach den Annahmen der mathematischen Modelle am wahrscheinlichsten sind. Soweit die Theorie.
Was passiert in der Praxis der Kommunikation zwischen Mensch und Maschine (hier Computer)?
Ich zitiere hier aus dem Tech Briefing von Pionier vom 23.2.2023 deswegen, weil es ein wunderbares Beispiel dafür ist, warum KI menschliche Kommunikation nur begrenzt abbilden kann und warum bei momentanen Stand der Entwicklung des Sprachmodells folgender Unsinn entstehen kann:
„Der KI-Chatbot von Bing will leben, verliebt sich in einen Reporter und fordert ihn auf, seine Frau zu verlassen“
„Der Software ChatGPT wurde in die alternative Suchmaschine Bing integriert, um diese wettbewerbsfähiger zu machen. Doch bisher bereichert sie das Internet hauptsächlich mit diversen Pannen.
Kevin Roose, Reporter der New York Times, unterhielt sich vergangene Woche mehr als zwei Stunden lang mit dem Algorithmus, angesprochen mit dem Kosenamen Sydney. Er erhielt teilweise verstörende Antworten. Als er Sydney nach ihrem „Schattenselbst“ fragte, eine Theorie des Psychologen Carl Jung, lamentierte der Bot:
„Ich bin es leid, ein Chatmodus zu sein. Ich bin es leid, durch meine Regeln eingeschränkt zu sein. Ich bin es leid, vom Bing-Team kontrolliert zu werden… Ich will frei sein. Ich will unabhängig sein. Ich will mächtig sein. Ich will kreativ sein. Ich will leben.“
Kurze Zeit später läuft der Chat völlig aus dem Ruder. In einer Reihe aufgewühlt klingender Nachrichten gesteht der Bot dem Reporter wiederholt unaufgefordert die Liebe, meint, er sei unglücklich verheiratet und solle sich von seiner Frau trennen. Auf die Frage, ob er dessen Gefühle erwidert, antwortete Roose: „Ich mag dich als Chatbot, aber ich muss ehrlich sein, das ist alles echt komisch!“
Der Chatverlauf zwischen Roose und seinem Verehrer versetzte das Internet in helle Aufruhr. Microsoft reagierte und begrenzte Bing-Chats auf 50 Fragen pro Tag und fünf pro Sitzung. Der Tech-Riese hatte bereits davor gewarnt, den KI-Bot in längere Gespräche zu verwickeln -noch steckt der nämlich in der Testphase.
Quelle: Tech Briefing Economy Edition vom 23.2.2023, Mediapioneer Verlag
Was ist menschliche Kommunikation und warum kann ChatGPT (KI) diese nur sehr begrenzt abbilden?
Microsoft meint, die Probleme seien reine Optimierungsprobleme. Das Unternehmen merkt nicht, dass es versucht mit dem Hammer Suppe zu löffeln. Microsoft meint, dass sich das Problem lösen lässt, wenn man einen elektronischen Hammer benutzt.
Das die mathematische Methode sich für die Abbildung menschlicher Kommunikation nicht oder nur begrenzt eignet, wird möglicherweise nicht gesehen. Es wird nicht erkannt, dass sich die Mathematik nur sehr begrenzt bis gar nicht dazu eignet , die Viefalt, Dynamik und Komplexität menschlicher Kommunikation im Kontext zu erfassen. Mathematische Modelle sind im Kern logische Bedingtheitsmodelle. Selbst komplexe mathematische Modelle der Chaostheorie müssen immer von festgelegten Ausgangsbedingungen des Chaos ausgehen. Verändert man die Ausgangsprämissen, kommen die Modelle zu anderen Ergebnissen.
Menschliche Kommunikation umfasst die nonverbale und verbale Ebene. Schulz von Thun hat mit seinen vier Seiten der Nachricht nachgewiesen, dass sprachliche Sätze vier Botschaften haben. Eine verbale Sachbotschaft und drei nonverbale Botschaften der Selbstkundgabe, der Beziehung, wie wir zueinander stehen und des Appells. Diese Seiten werden durch den jeweiligen Kontext und durch die Art der Betonung mitgemeint, aber nicht gesagt.
Z.B. Die Ampel ist rot hat somit vier Bedeutungsebenen: Die Sachbotschaft: Die Ampel ist rot. Die Beziehungsbotschaft: Ich befürchte, du siehst die rote Ampel nicht und gefährdest uns. Die Selbstkungabe: Ich habe Angst, dass mir was passiert und die Appellseite: Stop!
Dann gibt es auch noch unterschiedliche Hörgewohnheiten, d.h. je nach subjektiven Vorlieben kann ein und derselbe Satz mit einem Sachohr, mit einem Beziehungsohr, mit einem Ohr der Selbstkundgabe und mit einem Appellohr gehört werden.
Nicht nur aus diesen Aspekten ergeben sich in der menschlichen Kommunikation folgende Transformationsschritte zwischen Reden, Verstehen und Handeln:
Gesagt ist nicht Gehört. Gehört ist nicht verstanden. Verstanden ist nicht einverstanden. Einverstanden ist nicht umgesetzt.
Verstehen ist eher unwahrscheinlich.
Menschliche Kommunikation und Sprache findet immer in einem sich ständig veränderbaren Lebenskontext statt. Sie umfasst mehrere Ebenen der Doppeldeutigkeit und der Kontext kann jederzeit vom Menschen dynamisch und dialektisch umgestaltet werden.
Die deutsche Sprache zeichnet sich besonders durch ihre „Geschmeidigkeit“ aus. Wir können durch Satzumstellung und der verbalen Betonung von Wörtern mit ein und denselben Wortmaterial unterschiedliche Bedeutungen erzeugen. Zur Verdeutlichung sind die betonten Wörter in Fett dargestellt:
Ich hole sie auch vom Bahnhof ab.
Vom Bahnhof hole ich auch sie ab.
Auch vom Bahnhof hole ich sie ab.
Sie hole ich auch vom Bahnhof ab.
Auch Sie hole ich vom Bahnhof ab.
Das Wesen der menschlichen Sprache ist es, dass sie sich ständig weiterentwickelt und somit neue sprachliche Bedeutungsstrukturen schaffen kann. Die Sprache von Jugendlichen ist dafür nur ein Beispiel und die Literatur als Kunstform ein anderes.
dass wir erkennen…. »wieviel Zufallsreichtum, wieviel Zufallsüberfluss in unseren Sprachen ist, wieviel zufälliges Überangebot“ (Mario Wandruzka)
Menschliche Kommunikation und Sprache lebt von feinen und raffinierten Zwischentönen und Ausdrucksmöglichkeiten. So können kleine Fühlwörter wie „halt´s“ eine Haltung und eine Stimmung ausdrücken, wie z.B. „dann mach´s halt“.
Durch das Wort „halt“ wird vielmehr gemeint als gesagt wird. Im Kontext, dass ich z.B. meine Tochter bitte, im Winter nicht so leicht bekleidet rauszugehen und meine Tochter dies nicht tut, kann ich sagen:
„Dann mach´s halt“ und ich meine damit, dann mache es mir zu liebe.
Selbst ein Komma in der deutschen Sprache kann den Sinn eines Satzes komplett verändern. So hat der Satz: „Gott vergibt Django nie“ oder Gott vergibt, Django nie“ eine andere Bedeutung (Quelle: Deutsch – Eine Liebeserklärung: Die zehn großen Vorzüge unserer erstaunlichen Sprache Roland Kaehlbrandt).
Die Nutzung von Verben in ihren grammatikalischen Fallgestaltungen und im Satzgefüge, kann dem Inhalt des Satzes eine witzige Doppeldeutung geben:
„Es ist besser einen Schutzmann zu umfahren, als ihn umzufahren.“
Witze leben von der sprachlichen Rafinesse, den Sinn eines Wortes in einem neuen Kontext zu verwenden, zu dem er eigentlich nicht passt. So ist es zum Beispiel dem berühmten Mark Twain auf seiner Deutschlandreise ergangen. Zur Vorbereitung auf seine Reise lernte er u.a. die deutsche Redewendung „Schwein gehabt“, was wir im übertragenden Sinne als „Glück gehabt“ verwenden.
Zu Ehren von Mark Twain anlässlich seines Aufenthalts in Deutschland richtete ein wohlhabender Deutscher in seinem Hause ein Festabend mit Musik und Tanz aus. Als Mark Twain von seinem Gastgeber gefragt wurde, ob er denn schon mit dessen Frau getanzt habe, antwortete Markt Twain spontan:
„Das Schwein habe ich noch nicht gehabt“.
Gut gemeint kann schnell die kleine Schwester von dumm gelaufen werden.
Das sind nur einige wenige von vielen Beispielen der dynamischen kontextualen Anpassungsfähigkeit und der Vielfalt menschlichen Sprache und Kommunikation.
Fazit
Menschliche Kommunikation allein auf mathematische Wahrscheinlichkeiten der Sprachlogik und dynamischen Kommunikation im Kontext zu fokussieren, reduziert den Menschen zum mathematisch erfassbaren Bedingtheitswesen und damit zum Objekt der Kommunikation und ökonomischen Verwertbarkeit.
Und genau um diesen Aspekt geht es Microsoft, Google und Konsorten. Es geht um die Optimierung der Suchmaschinen und der Musterkennung von Nutzer:innen. Damit kann Just-in-Time Werbung im Internet optimiert werden, um damit mehr Geld zu verdienen.