Fast alle Werkzeuge, die wir «spielend» beherrschen, haben wir spielend gelernt. Das sollten wir auch bei generativer KI.
Letztes Wochenende las Ingrid Bohr einen Artikel über die Auswirkungen auf "die jungen Leute", mit dem sie nicht einverstanden war. Sie schrieb dazu ein Replik, aus der ich zwei Punkte aufgreifen möchte:
Lehrer: «Ich kann die Schularbeiten nicht mehr nach der Qualität der Formulierungen beurteilen»
So auf den Punkt gebracht, ist die Aussage sehr entlarvend. Sie zeigt aber einen tieferen Kern der menschlichen Psyche (und Erfahrungswelt) auf:
Wir sind uns gewohnt, dass eloquent formulierte Sätze meist fundierter und korrekter sind als schlampig formulierte Sätze. Wir hätten uns das schon lange abgewöhnen sollen:
1. Korrelation ≠ Kausalität
Nur weil etwas häufig gemeinsam auftritt, heisst das noch lange nicht, dass es einen ursächlichen Zusammenhang gibt. Beispielsweise bedeuteten in den Jahren 1999 bis 2009 mehr Filme mit Nicolas Cage auch mehr Leute, die in den USA in Pools ertrunken sind.
Kaum jemand wäre aber auf die Idee gekommen, Nicolas Cage solle gefälligst weniger Filme drehen, damit endlich nicht mehr so viele Personen ertränken.
2. Böser Wille
Nur weil wir gescheite Leute häufig auch richtige Aussagen machen, heisst das nicht, dass sie diese Aussagen machen, weil … vielleicht haben sie ja auch ein Interesse, die Zuhörer absichtlich in die Irr zu leiten.
So gehören Betrüger und Scharlatane oft zu den Menschen, die sich sehr überzeugend ausdrücken können.
Und wenn jetzt eine Schülerin oder ein Schüler bei einer Hausaufgabe oder Abschlussarbeit betrügen will, wird der Betrug möglichst glänzend daher kommen. Und dabei ist es egal, ob die Arbeit von einem Chatbot, einem Ghostwriting-Dienst oder den Eltern geschrieben wurde.
3. Klar ist es überzeugend!
Es hat auch Muster aus den überzeugendsten Texten im gesamten Internet extrahiert. Nicht alle davon sind auch korrekt. Und manchmal wird auch überzeugend formulierte Satire ernst genommen.
Dazu hilft es, die Herkunft der Daten zu verstehen:
Viel davon ist einfach im Internet gesammelt, mutmasslich mit wenig Qualitätskontrolle. Einiges ist von Reddit, u.a. satirische Beiträge. Und nur 3% der Trainingsdaten stammen aus relativ faktentreuen Quellen wie Wikipedia. (Inzwischen nimmt die Datenqualität von via Internetcrawl gesammelten Daten ab; und sich gegen das Sammeln zu wehren ist schwierig.)
4. Wir sind zu nett
Wenn man bei der Beantwortung einer Prüfungsfrage unsicher ist, schreibt man häufig mehr, in der Hoffnung, dass die Lehrperson dann schon das Richtige in diesen vielen Informationen finde und diese dann als korrekt benote. (Etwas ähnliches kann man übrigens häufig auch bei Antworten von KI-Sprachmodellen erkennen.)
Wenn es um eine faire Benotung einer Abschlussarbeit geht, darf man nicht seinen ganzen Goodwill in die positive Bewertung der Arbeit stecken, sondern soll den Prüfling dann auch nach Erklärungen fragen. Daran ändert auch KI nichts.
Spielen!
In Inge Bohrs Text gefällt mir insbesondere der Schlusssatz, der zum Ausprobieren animiert.
Werkzeuge, die wir als Kind spielerisch ausprobieren konnten — auch Dinge damit machen, die so nicht im Handbuch stehen(!) — beherrschen wir aus den Effeff und können Nutzen und Risiken einschätzen.
Mit der KI zu spielen und ihr auch ein paar konfuse Aufgaben zu stellen, hilft, die Grenzen und Möglichkeiten auszuloten. Ich empfehle deshalb allen, einmal mit einigen dieser Werkzeuge herumzuspielen, um ein Gefühl dafür zu bekommen und die Angst zu verlieren. Im Gegensatz zum Experimentieren mit einem Hammer ist das Experimentieren mit KI schmerzlos möglich.
KI-Systeme können zwar in beschränktem Masse interpolieren und extrapolieren. Das sind aber alles nur die oben erwähnten Korrelationen: Mit Glück passen sie, aber dieser Zusammenhang ist nicht kausal begründet. Insbesondere bei schwacher Datenlage (oder Böswilligkeit) kann da etliches schief gehen.
Wenn aus Spass Ernst werden soll
Wer also ein IT-System um KI-Funktionen erweitern will, sollte im Vorfeld schon gewisse Gedankenspiele anstellen (und dann auch damit spielen, bevor man es auf Kunden oder Angestellte loslässt):
- Was sind die typischen Anwendungsgebiete für die neue KI-Funktion? Wie verhält es sich bei diesen? Wieso?
- Was sind Sonderfälle, die es auch korrekt abhandeln sollte? Funktioniert es auch da? Und auch bei Sonderfällen, die anfangs nicht vorgesehen waren (also: Klare Trennung zwischen Trainings- und Testdaten!)
- Was passiert, wenn Laien oder Fremdsprachige mit diesem System umgehen? Insbesondere auch dort bei Standard- und Sonderfällen.
- Was könnte jemand Böswilliges damit anstellen? Was wären die Auswirkungen davon? Kann man die zuverlässig abfangen?
Die KI mag der «universelle Praktikant» sein, dem man mal alles geben kann und der vieles halbwegs richtig macht. Aber dieser Praktikant ist auch extrem naiv und lässt sich immer und immer wieder auf dieselbe Art und Weise übertölpeln. Man sollte ihn also erst nach guten Überlegungen ohne dauernde Aufsicht auf Menschen loslassen.
Ich will Spass!
Solange wir aber einen guten Spielpartner brauchen, der uns einige Arbeit abnimmt, mit dem die Arbeit Spass macht und der manchmal auch Spässe macht, dann ist die KI ideal. Man muss aber bereit sein, die subtilen "Spässe" (Fehlinformationen, «Halluzinationen», …) jederzeit rechtzeitig zu erkennen.
Also los, gehen wir spielen!
Weiterführende Texte
- Ingrid Bohr: Ein neues Werkzeug, Agile Verwaltung, 2024-08-22.
Der lesenswerte Artikel, der mich wiederum zu diesem Artikel inspiriert hat. - Marcel Waldvogel: «Quasselquote» bei LLM-Sprachmodellen, 2024-01-11.
Einige Eigenschaften von KI-Modellen beim Umgang mit Prüfungsfragen ("alles aufschreiben und hoffen, die Lehrerin suche sich dann schon die richtige Antwort heraus") - Marcel Waldvogel: Identifikation von KI-Kunst, 2023-01-26.
Artikel aus der Frühzeit der KI-Bilderzeugung, mit einigen typischen KI-Fehlermustern. Die meisten davon sind inzwischen nicht mehr so klar und häufig aufzufinden. - Marcel Waldvogel: Machine Learning — Künstliche Faultier-Intelligenz, DNIP, 2022-08-16.
Erklärt die Grundlagen von KI und woher die Fehler stammen. - Marcel Waldvogel: «KI» und «Vertrauen»: Passt das zusammen?, 2023-12-11 (Langversion bei DNIP).
Wo wir KI vertrauen dürfen. Und dass Vertrauen in die Firmen hinter KI gefährlich ist. - Noah Smith: Interview: Kevin Kelly, editor, author, and futurist, 2023-03-07.
Quelle der Aussage mit dem "universellen Praktikanten" ("universal intern").