Am Rand von Gutenbergs Schatten

Eine weitere Sichtweise zu Haiku und KI (1)
von Beate Conrad

„KI [Künstliche Intelligenz] macht große Fortschritte […], aber wird sie Dichter und Schriftsteller ersetzen können? Sobald sicherlich nicht. Einfach weil sie keine Freude erfahren kann. Die Freude am Humor. Von Wörtern. Sich mit einem anderen Menschen zu verbinden. Und Schreiben ohne Freude ist einfach nicht dasselbe.“ – Anu Garg, *Wordsmith*

Seit Menschengedenken gibt es technische Ansätze, die uns Menschen verbessern, ersetzen oder uns gar Gott gleichmachen sollten. Dafür stehen der mythische Tonkoloß Golem, die erstaunlichen Apparaturen der Griechen ebenso wie Da Vincis Bilder mechanischer Menschmaschinen. Henri Maillardets mechanische Menschen des 18. Jahrhunderts, die schön anzusehen sind und ebenso schön schreiben und zeichnen können (2), erinnern an die ersten Automaten. Konrad Zuse legte den entscheidenden Grundstein mit seinem ersten echten, also programmierbaren Computer Z3 in 1941. Im selben Jahr formulierte Isaac Asimov seine drei Robotergesetze. 1961 setzte man den ersten digital programmierbaren Roboter in der Industrie ein. Mit WABOT entstand fast zeitgleich in Japan der erste humanoide Roboter. Um die Milleniumwende sind die ersten Labor- und Spielzeugexemplare von Androiden entwickelt worden. Neben den fortschreitenden Versuchen im Bereich der neuronalen Netzwerke und erheblichem Data-Mining soll neuerdings die sogenannte vierte industrielle Revolution (3) den Weg zum „Internet of the Body“ bahnen, wohin in der Zukunft u. a. das Gehirn ausgesuchter Menschen zum ewigen Leben hochgeladen werden könnte (4).

Doch nicht allein deshalb lehne ich mich derzeit ruhig zurück, wenn ich computergenerierte Kunst in Form von Bildern, Musik oder Textprodukten und auch Haiku betrachte. Die sogenannte KI, die diesen erwähnten Produkten unterliegt bzw. unterliegen soll, besteht aus einer Kombination des von Menschen Vorgegebenen. Das bezieht sich sowohl auf die gesamten Operationen als auch auf die verfügbaren Daten, die sie dazu notwendig brauchen. Es geht also um Verknüpfungsmechanismen und definierte Datenbasen.

Im Falle der computergenerierten Haiku und Aufsätze handelt es sich um relativ einfache Rechenoperationen. Es werden von Menschen zuvor erfundene und geschriebene Wörter und Wortkombinationen neu, also anders unter bestimmten Gesichtspunkten zusammengestellt. Eine Maschine kann diese Datenmassen im Netz schneller durchsuchen und nach statistisch bestimmten Wahrscheinlichkeitscharakteristika errechnen und anordnen. Sie kann sogar verschiedenartige Vorgänge kombinieren und nach ebenfalls vorgegebenen Parametern rechnerisch besser optimieren als wir.

Was die Eigenschaften solcher Haiku angeht: Natürlich werden sie zum Teil so wahrgenommen wie im japanischen Experiment (5) beschrieben. Denn sie sind zwar anders arrangiert, aber alle durchwegs menschlich (schön). Es handelt sich um von Menschen geschaffenes Schöngeistiges, das uns als scheinbar Eigenständiges entgegentritt. Tatsächlich stellen sie jedoch nur variable Reproduktionen dar. Sie sind nicht aufgrund eines unterschwelligen Impulses oder angetrieben aus eigenständigem Erfahrungserleben, sondern auf Aufforderung nach vorgegebenen Parametern geschrieben worden. Sie sind mechanistische Spiegel unseres Schaffens. Sicher, ein gut gefälschtes Gemälde mag mitunter anziehender wirken als das Original. Um jedoch das generierte Ergebnis adäquat einschätzen zu können, fehlt uns zunächst der echte Vergleich. Einem Programm stehen Datenmengen und Details zur Verfügung, die wir selbst ad hoc nicht parat haben, geschweige denn in der Geschwindigkeit überblicken und bearbeiten könnten. Die Unmenge an derweil ausgeworfenen Produkten erschlägt uns eher. Allerdings erahnen wir bei näherer Betrachtung mit kühlem Kopf, daß die Ergebnisse doch nicht so überwältigend sind wie sie zunächst erscheinen.

Bei komplizierteren Texten, wie einer Interpretation oder einer überhaupt ernstzunehmenden Haikubesprechung, sieht die Sache nämlich schon anders aus. In Volker Friebels Interpretationsbeispiel (1) mit ChatGPT wird deutlich, daß das medial so hochgelobte Sprachprogramm das ebenfalls nur medial Versprochene eben nicht wirklich halten kann (6). Das wundert mich auch nicht. Denn das auf KI basierende Programm ist so dumm oder so schlau wie seine Vorgaben und die aus dem Internet verfügbaren Informationen. Es bemerkt zum Beispiel weder den strukturellen Aufbau in- und übereinandergelegter Sichten noch den etwas expressionistisch interpretierenden Sprachausdruck „krallt in den Himmel“, der dem authentischen Blickwinkel des inneren Sprechers, also der Sicht auf den Vogel am Boden nicht entspricht (7), der sich aber mit den verschiedenen Perspektiven im Flimmern – ähnlich einer Fatamorgana – räumlich, sinnlich und sprach-inhaltlich verbindet. Stattdessen wird uns wenig anderes vorgeführt als der blinde Spiegel eines etwas naiv (be)wertenden Interpretationsstils wie aus dem deutschsprachigen Netz, – und auch das nur durch modifiziertes Nachfragen. Das Ergebnis des Sprachprogramms zeigt selbst im Fall dieses noch relativ einfachen Zusammenhangs seine Fehlerhaftigkeit an: Nämlich die eigentliche Materie nicht wirklich zu verstehen. Stattdessen verknüpft es sie mit systemimmanenter, also vorgegebener ideologischer Kurzsichtigkeit. Geistige Durchdringung, Erleben und intuitives Verständnis, was eine adäquate Haikubetrachtung voraussetzt, geht anders.

Wir wissen, daß Künstliche Intelligenz auf neuronalen Netzwerken basiert. Was heißt das genau? Man versucht generelle Hirnfunktionen aus der Natur nachzuempfinden. Dabei hat man festgestellt, daß neuronale Netze assoziativ funktionieren. Mit entsprechendem Training können Programme also Sprach- und Bilderkennungs- sowie Übersetzungsfunktionen leisten, ohne jedoch selbst deren Sinn zu verstehen. Neuronales Lernen passiert dabei anhand definierter Rückkopplungen durch verschiedene Tensoren, also auf verschiedenen Ebenen oder Schichten. Der Gesamtvorgang derartigen Lernens nennt sich „deep learning“. Die Gewichtung der einzelnen Rückkoppelungen und deren Zwischenschritte ist allerdings selbst für die sich damit beschäftigenden Experten noch relativ undurchsichtig.

Überhaupt gibt es kein umfassendes Verständnis oder Konzept für Intelligenz. Stattdessen gibt es nur partielle Geltungsbereiche bestimmter Definitionen. Wir wissen nicht, warum wir in der Lage sind, Neues zu denken. Und wir wissen auch nicht, was der eigentliche Ursprung einer Idee ist.

Dennoch müssen wir uns fragen: Wird eine solche neuronal sich entwickelnde Maschine irgendwann etwas außerhalb des Definierten und Verfügbaren tun können? Wird sie auf einer Metaebene reagieren wie wir? Wo wir unser eigenes Denken und Handeln im Ablaufen gleichzeitig betrachten und beurteilen, wo wir korrigieren und unerwartete Richtungen einschlagen können? Wird der Computer bzw. das neuronale Netzwerk Neues erfinden können? Wird es gar durch etwas außerhalb des Netzes inspiriert sein können?

Bisher verstehen wir lange noch nicht, wie all unsere verschiedenen, geistigen höheren Operationen sich in der Interaktion mit der Umgebung aufbauen und wiederum unter sich ständig neu verknüpft im Einzelindividuum verwendet werden, wie dabei neue Verknüpfungen, Querverweise, partielle Überschreibungen funktionieren und welche Interaktionen ihnen vorausgingen. Und ebenso wichtig: Bislang besteht unsere Erlebniswelt nicht ausschließlich aus Computern und Internet, die der KI im oben angesprochenen Aufgabenbereich hingegen schon. Ganz gleich wie intelligent eine künstliche Intelligenz eines Tages wäre, sie bliebe eine künstliche, die sich von uns Menschen und unserem Denken deutlich unterscheidet (9). Zudem ist sie gar nicht auf semantisches oder intuitives echtes Verstehen von Sprache und Welt ausgerichtet, sondern auf das numerisch effiziente Verarbeiten von Signalen und Datenflüssen. Genau das zeigt sich in dem kleinen Beispiel der Haikuinterpretation, wo das menschliche Erleben im Haiku sich der KI nicht erschließt, aber zur Perzeption solcher Texte eben doch notwendig ist.

Aufgrund dieser Begrenzung und ohne zusätzliches ‚Nudging‛ zur jeweiligen Aufgabenstellung neigt die KI etwas zur Monotonie, manchmal zur Verarmung oder auch zur Übertreibung und ‚Erfindung‛. Sie produziert in Sekundenschnelle Unmengen an qualitativ fraglichen Sprachprodukten, die zukünftig der KI selbst das Lernen erschweren könnten und das allgemeine Informationschaos vermehren. Indes neigen wir Menschen bei hohem Datenaufkommen dazu, schnell die Übersicht zu verlieren, sind jedoch Meister der freien Assoziation. Das ist uns in die Wiege gelegt. Noch gibt es zwischen den menschlichen freien Assoziationen und den neuronal generierten einen großen qualitativen Sprung, der zur Zeit weder durch die verfügbare Hardware noch durch verschiedene Trainingsansätze zu bewältigen ist. Auf dem Gebiet macht uns keine KI etwas vor (8). Auch das kann uns schöpferische Haikunauten beruhigen. Ob das jedoch in der ferneren Zukunft so bleiben wird, wenn die Assoziationsfunktionen sich erweitern und ständig mit endlosen Daten trainiert werden, das wissen wir (noch) nicht.

Lassen wir uns also nicht blind von diesen Vorgängen beeindrucken. Unter- und überschätzen wir deren Ergebnisse nicht, sondern sehen und nehmen wir sie für das, was sie sind: Versuche der partiellen Nachbildung unserer noch wenig verstandenen ‚Intelligenz‘, nicht die unseres Geistes, unserer Seele oder unseres Gesamtwesens. Allerdings ist der derzeitige Umgang mit der KI auch kritisch zu sehen. Denn es besteht selbst auf Seiten der damit beschäftigten Fachleute wenig Einsicht in die tieferen Prozesse des angeregten maschinellen Lernvorganges. Das heißt, daß Lernvorgänge im neuronalen Netzwerk nicht mehr berichtigt oder rückgängig gemacht werden können, wie das bei bisherigen normalen Programmen der Fall ist. Außerdem hat die KI schon in ihrem gegenwärtigen Zustand durchaus Potential zu vielerlei Mißbrauch.

Wer sich derzeit mit Sorge im Wettbewerb mit der Rechengewalt solcher Systeme sieht, dem stehen Optionen zur Verfügung: Die erste heißt Enthaltsamkeit. Don’t feed the beast! Die zweite wäre, ausschließlich an der Gutenbergschen Welt des Drucks und Papiers festzuhalten. Wir können jedoch auch ein kritisch-konstruktives Bewußtsein und Wissen im Umgang mit Maschinen entwickeln, so daß die Maschine für uns zum Werkzeug wird, und nicht umgekehrt. Der KI muß schließlich gesagt werden, was sie tun soll. Wir hingegen können gar nicht anders als Kunst aller Art zu schaffen. Das belegt unsere gesamte Menschheitsgeschichte. Warum also nicht neben unserer herkömmlichen und überlieferten Kultur gezielt die neuen Werkzeuge sinnvoll dort nutzen, wo sie unsere eigene künstlerische Ausdrucksfähigkeit verbessern könnten. Vor allem aber sollten wir natürlich nicht unsere eigenen mentalen und kreativen Fähigkeiten aus e-Bequemlichkeit vernachlässigen. Streben wir eine Balance an zwischen Ginko, Gutenberg und den e-Pfaden durchs Maschinenland.

 Anmerkungen und Literatur:

1. Volker Friebel: Gutenbergs Schatten, 15.03. 2023. Online:
https://www.haiku-heute.de/archiv/friebel-2023-gutenbergs-schatten-computer-generierte-haiku/ (abgerufen am 11.4.2023)

2. The Met: Making Marvels—The Draughtsman-Writer. Online: https://youtu.be/7ZiH7oF3OMM (abgerufen am 11.4.2023)

CBS Sunday Morning: Lost Art of Atomatons alive again. Online: https://youtu.be/C7oSFNKIlaM (abgerufen am 11.4.2023)

Fran Blanche: Solving The Mystery Of The Maillardet Automaton.
Online: https://youtu.be/zpJEP6O6-Ho (abgerufen am 11.4.2023)

3. Klaus Schwab: The Fourth Industrial Revolution [Die vierte industrielle Revolution]. WEF, 2016

4. Yuval Noah Harari: Homo Deus. A Brief History of Tomorrow [Homo Deaus. Eine kurze
Geschichte von Morgen]. Vintage, UK, 2016

5. Japan Study: People cannot distinguish between human-made and AI-generated haiku. [Leute unterscheiden nicht zwischen menschengemachten und KI-generierten Haiku]. The Mainichi, Nov. 5th, 2022. Online: https://mainichi.jp/english/articles/20221104/p2a/00m/0sc/012000c (abgerufen am 11.4.2023)

Jimpei Hitsuwari, Yoshiyuki Ueda, Woojin Yun, Michio Nomura: Does human–AI collaboration lead to more creative art? Aesthetic evaluation of human-made and AI-generated haiku poetry [Führt die Zusammenarbeit zwischen Mensch und KI zu mehr kreativer Kunst? Ästhetische Bewertung von menschengemachter und KI-generierter Haiku-Poesie]. Online: https://www.sciencedirect.com/science/article/abs/pii/S0747563222003223 (abgerufen am 11.4.2023)

6. Philipp Schönthaler: Schneller als gedacht. ChatGPT zwischen wirtschaftlicher Effizienz und menschlichem Wunschdenken. Grenzen der Sprach-KI. C’t Magazin für Computertechnik. Heft 9, April 2023. S. 126-131.

7. Mein Dank gilt Horst Ludwig für seine Anmerkung zum Haiku „Asphaltflimmern. / Die tote Amsel krallt / in den Himmel.“ zur Perspektive des inneren Betrachters, die höher als die der Amsel und mit „in den Himmel“ besondere Erklärung verdiente.

8. Pina Merkert: Statistik ist nicht Denken. Wie sich künstliche Intelligenz von menschlicher unterscheidet. C’t Magazin für Computertechnik. Heft 24, November 2018. S. 134.

9. Philipp Bongartz, Pina Merkert: Skalierungshypothese vs. Neurosymbolik. Welche Schritte muss die KI-Forschung gehen? C’t Magazin für Computertechnik. Heft 23, Oktober 2022. S. 124-130.