Verändert KI unsere Kunstwahrnehmung?

Ein kleines Experiment

Andreas Mertin

Im Nachgang zu meinem Artikel „Ist das Kunst oder bloß kulturelles Kapital?[1] stellte ich mir die Frage, wie wohl die sich ausbreitenden Chat-Bots die Kunstwahrnehmung der Menschen verändern werden. In dem Maße, in dem die Suchmaschinen und auch Office-Programme die Leistungen künstlicher Intelligenzen in ihre Arbeitsweise integrieren, werden sie auch durch ihre Vorschläge und Antworten auf bestimmte Fragen notwendig Einfluss darauf nehmen, wie Kunstwerke wahrgenommen werden. Die Frage ist, ob sich dabei notwendig auch die verschiedenen Sichtweisen, die Pierre Bourdieu in „Die feinen Unterschiede“[2] beschreibt, verändern.

So kann man schon vorab davon ausgehen, dass die Wahrnehmungsweise der unteren Schicht bei ChatGPT oder der mit ChatGPT arbeitenden Suchmaschine Bing so gut wie keine Rolle spielen wird. Die lebensweltliche und funktionale Annäherung wird vielleicht nicht gerade als illegitime Annäherung charakterisiert, aber sie wird wohl schlicht beiseitegelassen. Das könnte bei ganz berühmten Bildern anders sein, aber der Regelfall ist, dass lebensweltliche Motive wegfallen.

Die Fragestellungen der mittleren Schicht, auch das vermute ich vorab, werden schon eher bedient, weil die Anerkennung innerhalb des Kunstsystems bei den Antworten der KI sicher eine Rolle spielen wird. Ist es ein bedeutender Künstler, ist es ein bekanntes oder sogar berühmtes Werk, hängt es in einem berühmten Museum? Das sind die interessierenden Fragen.

Am ehesten dürfte das System dem Wahrnehmungsschema der gehobenen Schichten entsprechen. Die KI wird die formale Sprache der Kunstgeschichtler und Kunstwissenschaftler reproduzieren und somit dazu beitragen, die „legitime“ Wahrnehmungsform der oberen Schichten als normative zu verstärken.

Soweit meine Vermutungen, schauen wir, ob das so ist und wie es funktioniert. Zunächst habe ich nach dem Künstler gefragt, über den sich im Internet und in den klassischen Lexika und selbst in der Wikipedia wenig Informationen finden.

A.M.:        Ich suche Informationen über den Maler Ludovic Rodolphe Pissarro.

ChatGPT:   Ludovic Rodolphe Pissarro, geboren am 17. März 1878 und gestorben am 10. Juli 1952, war ein französischer Maler und Grafiker. Er war der jüngste Sohn des berühmten impressionistischen Malers Camille Pissarro und spielte eine bedeutende Rolle in der Entwicklung der neoimpressionistischen und pointillistischen Kunstbewegungen.

Ludovic Pissarro wurde in Paris geboren und wuchs in einer künstlerisch geprägten Familie auf. Er wurde von seinem Vater Camille und seinem Onkel Lucien Pissarro, ebenfalls ein bekannter Maler, in der Kunst ausgebildet. Ludovic begann früh, in den Fußstapfen seines Vaters zu treten und entwickelte seinen eigenen Stil, der von der neoimpressionistischen Technik beeinflusst war.

In den frühen Jahren seiner Karriere malte Ludovic Pissarro Landschaften und Szenen des ländlichen Lebens, oft mit hellen Farben und einer Betonung des Lichts und der Textur. Später experimentierte er mit pointillistischen Techniken, bei denen er kleine Farbpunkte anstatt breiter Pinselstriche verwendete, um seine Bilder aufzubauen. Diese Technik erzeugte eine optische Mischung der Farben und eine lebendige Wirkung.

Ludovic Pissarros Kunstwerke wurden in zahlreichen Ausstellungen in Frankreich und im Ausland gezeigt. Er beteiligte sich auch an den jährlichen Ausstellungen der Société des Artistes Indépendants und der Salon d'Automne. Seine Werke fanden Anerkennung für ihre technische Brillanz und ihre Fähigkeit, die Schönheit der Natur einzufangen.

Abgesehen von seiner eigenen künstlerischen Arbeit spielte Ludovic Pissarro eine wichtige Rolle bei der Erhaltung des künstlerischen Erbes seiner Familie. Er war ein leidenschaftlicher Sammler von Werken seines Vaters Camille Pissarro und anderer Impressionisten. Er gründete das Wildenstein Institute, das sich der Erforschung und Förderung der impressionistischen Kunst widmete. Ludovic trug auch zur Veröffentlichung des ersten Katalogs der Gemälde seines Vaters bei, der eine wichtige Referenz für Kunsthistoriker wurde.

Ludovic Rodolphe Pissarro hinterließ ein reiches Erbe in der Kunstwelt und trug zur Entwicklung des neoimpressionistischen und pointillistischen Stils bei. Seine Werke werden noch heute in renommierten Museen und Galerien weltweit ausgestellt.

Soweit ChatGPT. Einiges ist missverständlich formuliert bzw. bezieht sich eigentlich auf den Vater des Künstlers Camille Pissarro. Aber im Großen und Ganzen bekommt man hier fest mehr Informationen als sie von der Wikipedia oder in Kunstlexika bereitgestellt werden. Das ist schon beeindruckend. Insbesondere macht sich hier die sprachliche Vielfalt des ChatBots bemerkbar, denn dieser greift auf zahlreiche internationale Quellen zurück und kombiniert die Informationen daraus.

Wie vermutet spielen die Fragestellungen der unteren Schicht in der Beschreibung durch die KI tatsächlich überhaupt keine Rolle – nicht einmal im Sinne eines historischen Rückblicks. Nun ist das vielleicht dem Umstand geschuldet, dass ich noch nicht nach dem konkreten Werk gefragt habe, sondern allgemein nach dem Künstler. Biografische Details, an die man anknüpfen könnte (wie das anarchistische Engagement des Künstlers), fehlen im ChatGPT-Text. Über sein Ethos wird nichts bekannt – obwohl er ja in einer Zeit lebt, in der das politische Engagement der avantgardistischen Künstler:innen verbreitet war. Alle anderen Informationen spielen in der Lebenswelt der unteren Schichten, so wie Bourdieu sie beschreibt, keine Rolle.

Im Blick auf die Fragen der mittleren Schicht spielt die Darstellung des Renommees eine wichtige Rolle. Der Bot betont mehrfach die bedeutende Rolle, die der Künstler in der Kunst gespielt habe – was nicht zutrifft. Aber aufgrund der Beschreibung könnte man den Eindruck bekommen, hier mit einem Künstler konfrontiert zu werden, der in der großen Tradition seines berühmten Vaters steht. Camille Pissarro gehört immer noch zu den wichtigsten Künstlern der Welt und wird ganz anders bewertet als sein Sohn. Für die mittleren Schichten ist aber dieser Zusammenhang nicht unmaßgeblich. Die Behauptung, dass Ludovic Rodolphe Pissarro in bedeutenden Museen ausgestellt wird, zielt aber auf das Denken der mittleren Schicht.

Dominant sind bei der Antwort von ChatGPT aber formale Argumente, Einordnung in Stile (beeinflusst von der neoimpressionistischen Technik. Beteiligt an Ausstellungen der Société des Artistes Indépendants und der Salon d'Automne …). Dementsprechend kann die gehobene Schicht ihre Urteile über den Künstler fällen. Da sie über ein kunstspezifisches Wertesystem verfügen, können sie die einzelnen Informationen einordnen. Impressionismus, Neoimpressionismus, Pointillismus, Licht und Textur sind für sie wichtige Auskünfte.

Was „lernt“ man bei ChatGPT? Wir sind ja noch nicht beim kulturellen Konsum, sondern erst bei den Rahmenbedingungen. Aber bereits diese werden von der KI vor allem im Sinne der mittleren und oberen Schichten gefüllt.

Bildanalyse                                                              

Nun kann man inzwischen die Künstliche Intelligenz auch um Bildanalysen bitten (eine gute Nachricht für Schüler:innen). Bedenkt man jedoch, wie schwer es für eine Künstliche Intelligenz ist, ein ihr unbekanntes Bild zu analysieren und die Analyse dann in eine Beschreibung umzusetzen, dann wird man im Moment noch über bestimmte Schwächen hinwegsehen müssen. So kombiniert die KI im vorliegenden Fall etwa das analysierte Bild mit Beschreibungen anderer Bilder des Künstlers und fügt daher Bildelemente hinzu, die auf dem fraglichen Bild gar nicht zu sehen sind (oder missversteht bestimmte Bildstrukturen). Das wird sich mit der Zeit ändern und die Ergebnisse werden immer besser werden. Im Augenblick muss man aber noch jeden Satz der Bildbeschreibung hinterfragen. (Aber das gilt ja auch für die anderen Aussagen von ChatGPT, nicht nur für Bildbeschreibungen.)

Aber darum geht es mir im Moment nicht. Meine Frage geht eher dahin, wie ChatBots die Bildwahrnehmung und Bilddeutung, also den kulturellen Konsum verändern werden und was das für die verschiedenen Annäherungsformen der drei Schichten nach Bourdieu in Zukunft bedeuten wird. Als wie normativ werden die Bildbeschreibungen von ChatGPT von den Nutzer:innen empfunden? Welche Aspekte der Wahrnehmung werden die KI-Bots aufgreifen und welche Perspektiven werden sie nicht berücksichtigen?

Ich bitte ChatGPT also um eine Bildbeschreibung.

A.M.:        Ich brauche eine Bildbeschreibung von "Le Falstaff" von Ludovic-Rodo Pissarro.

ChatGPT:   "Le Falstaff" ist ein Gemälde des französischen Künstlers Ludovic-Rodo Pissarro. Das Gemälde zeigt eine lebhafte Szene in einem Pariser Café, das nach der berühmten Shakespeare-Figur Sir John Falstaff benannt ist. Die Bildbeschreibung beginnt mit der Betrachtung des gesamten Gemäldes und widmet sich dann den einzelnen Elementen.

Das Gemälde präsentiert eine gut besuchte Szene in einem eleganten Café. Im Vordergrund befinden sich verschiedene Personen, die an kleinen Tischen sitzen und in Gespräche vertieft sind. Die Menschen sind stilvoll gekleidet, was auf eine gehobene Gesellschaft hinweist. Die Farbpalette des Gemäldes ist warm und einladend, mit vielen lebendigen Tönen von Rot, Gelb und Braun.

Der Blick wird von links nach rechts durch das Bild geführt. Am linken Rand befindet sich ein älterer Herr in einem schwarzen Anzug, der sich nach vorne lehnt und angeregt mit einer Frau in einem roten Kleid spricht. Sie scheint ihm aufmerksam zuzuhören und gestikuliert leicht mit ihren Händen. Hinter ihnen sitzt ein Mann mit grauem Haar und einer Lesebrille, der in einem Buch liest.

In der Mitte des Gemäldes steht ein Tisch, an dem drei Männer sitzen. Der Mann in der Mitte, vermutlich der Namensgeber Falstaff, ist beleibt und trägt einen auffälligen grünen Anzug. Er hält ein Glas in der Hand und lacht herzlich. Die beiden Männer neben ihm scheinen ihm aufmerksam zuzuhören und sind in ein angeregtes Gespräch vertieft. Der Tisch ist mit einer weißen Tischdecke bedeckt und mit Flaschen, Gläsern und Tellern gedeckt.

Im Hintergrund des Bildes erstreckt sich das Café mit weiteren Gästen, die an Tischen sitzen und sich unterhalten. Es herrscht eine angenehme und entspannte Atmosphäre. Die Wände des Cafés sind mit Gemälden und Spiegeln geschmückt, was dem Raum eine gewisse Eleganz verleiht.

Die Maltechnik von Ludovic-Rodo Pissarro ist gekonnt und detailreich. Die Figuren sind sorgfältig ausgearbeitet, und die Verwendung von Licht und Schatten verleiht ihnen eine räumliche Tiefe. Pissarro hat es geschafft, die Stimmung und das lebhafte Treiben des Cafés einzufangen und dem Betrachter einen Einblick in das Geschehen zu gewähren.

Insgesamt ist "Le Falstaff" von Ludovic-Rodo Pissarro ein fesselndes Gemälde, das eine Szene des gesellschaftlichen Lebens im Paris des späten 19. Jahrhunderts einfängt. Es zeigt die Begegnung verschiedener Charaktere in einem Café und fängt die Atmosphäre und das Flair dieser Zeit auf beeindruckende Weise ein.


Soweit ChatGPT. Das ist ebenso amüsant wie lehrreich. Dass die KI zunächst Falstaff korrekt als Reminiszenz an die Shakespeare-Figur identifiziert, um sie dann kurz darauf als Figur der realen Lebenswelt zu deuten, zeigt, dass sie zwischen Fiktion und Realität an dieser Stelle nicht unterscheidet.[3] Einige Bildelemente werden anderen Gemälden von Pissarro entnommen. Auch die Gefühle und Handlungen der dargestellten Figuren werden kaum korrekt eingefangen – die Frau gestikuliert nicht, sie hört kaum zu. Ihr Partner spricht auch nicht, denn er hat eine Pfeife im Mund. Eine sorgfältige Bildanalyse sieht anders aus.

Die größte Fehleinschätzung unterläuft der KI aber in der Bestimmung des sozialen Kontextes, der im Kunstwerk von Pissarro gespiegelt wird. Keinesfalls handelt es sich um ein elegantes Café und auch nicht um eine gehobene Gesellschaft (darauf deutet eigentlich schon der Name „Le Falstaff“ hin[4]). Nur weil Pelzmäntel getragen werden, ist man noch nicht in besseren Kreisen (das ist so, als würde man von Kronleuchtern an der Decke auf Adel schließen). Wie aus dem Paar am Tisch ersichtlich ist, handelt es sich eher um eine Milieukneipe im Pariser Viertel Montparnasse, das damals nicht nobel, sondern nur ein Künstler:innenviertel  war. Und die Situation ist eine, wie wir sie auch aus Gemälden von Edgar Degas kennen. Man könnte fast von einem Zitat aus einem ikonischen Vorbild von Degas sprechen: L’Absinthe aus dem Jahr 1876. Dort handelt es sich aber nicht um eine Prostituierte, sondern um eine Schauspielerin.

Aber letztlich geht es hier nicht um die inhaltlichen Aspekte. Es geht darum, welche Aspekte in der Bildbeschreibung überhaupt eine Rolle spielen. Also, wie die Künstliche Intelligenz das Bild wahrnimmt und in welcher Relation das zu den Beobachtungen von Betrachter:innen der drei verschiedenen von Bourdieu beschriebenen sozialen Schichten stehen könnte.

Anknüpfungspunkte bietet das Gemälde für alle drei Gruppen. Bereits auf einer lebensweltlichen Ebene ist es interessant. Neun Personen befinden sich im Bild, von denen sechs Frauen sind. Da es sich nicht wirklich um ein Café handelt, sondern eher um eine Kneipe, ist das für das ausgehende 19. Jahr­hundert schon überraschend. Interpreten, die alles auf einem Bild auf ihre eigene Lebenswelt beziehen, würden die dargestellte Situation vermutlich sofort erkennen und zu deuten wissen.

Wenn sich Menschen der unteren Schichten auf die von der KI generierte Bildbeschreibung verlassen würden, dann geriete die lebensweltliche Perspektive aus dem Blick. Sie fänden sich selbst nicht nur in der Beschreibung nicht wieder (die Ausnahme bildet der Satz „Es zeigt die Begegnung verschiedener Charaktere in einem Café“), sondern sie hielten vielleicht auch ihre eigene Bilderfahrung nicht mehr für angemessen. Aus der Sicht der „herrschenden“ Perspektiven ist die lebensweltliche und funktionale Annäherung eher ‚barbarisch‘, das Weglassen von dazu passenden Informationen daher nachvollziehbar. Eine daraus sich ergebende Wandlung der Zugangsform der unteren Schicht geschähe aber nicht durch Einsicht, sondern durch kulturindustrielle Pädagogik. Wenn die lebensweltliche und funktionale Perspektive aber einen eigenen Wert darstellt, dann müsste sie als solche Berücksichtigung finden – auch im Sinne der Bestätigung ihres Blicks. Die Beschreibung durch ChatGPT legt aber sehr viel Wert darauf, genau diese Anknüpfungspunkte zu verschleiern. Den Künstlern des ausgehenden 19. und beginnenden 20. Jahrhunderts lag aber sehr viel an genau diesen lebensweltlichen Perspektiven, dem leeren Blick der Akteure, dem stummen nebeneinander Sitzen, die Sexualität als Ware. All das kommt in der Beschreibung nicht vor.

Wenden wir uns der zweiten Perspektive zu, also dem prätentiösen Geschmack, wie Bourdieu schreibt, der sich an Bedeutung und Eindruck orientiert, aber eigentlich die sedimentierte herrschende Kultur meint. Dieser Blick findet durchaus seine positive Resonanz in der Beschreibung von ChatGPT. Bourdieu nennt als charakteristisch „prätentiösere Adjektive“ wie „nobel“ oder „raffiniert“. Und davon bietet die Beschreibung tatsächlich einige: elegant - stilvoll - gehoben - gewisse Eleganz  - gesellschaftliches Leben im Paris des späten 19. Jahrhunderts. Auch wenn die Beschreibung ja wie wir gesehen haben kontrafaktisch ist, so erfüllt und bestätigt sie doch die Bedürfnisse einer Schicht, die an einem nobel wirkenden Ambiente interessiert sind.

Für die dritte Perspektive zählen eher die formalen, von der Lebenssituation und der gesellschaftlichen Charakterisierung abstrahierten Beschreibungen. Sie löst sich vom lebensweltlichen und wendet sich der Kunstform zu. Auch sie werden bedient und bestätigt. Auffallender Weise sind es hier nicht nur einzelne Worte, sondern ganze Sätze, die ihre Interessen bedienen: Die Farbpalette des Gemäldes ist warm und einladend, mit vielen lebendigen Tönen von Rot, Gelb und Braun … Der Blick wird von links nach rechts durch das Bild geführt … Die Maltechnik von Ludovic-Rodo Pissarro ist gekonnt und detailreich. Die Figuren sind sorgfältig ausgearbeitet, und die Verwendung von Licht und Schatten verleiht ihnen eine räumliche Tiefe. Diese Zugangsform wird durch die Beschreibung der KI sehr verstärkt. Sie ist sozusagen die angemessene für die Erschließung eines Kunstwerks wie das von Pissarro. So soll man über und vor Gemälden sprechen.

Damit erweist sich aber die KI als ideologisch bestimmtes Konstrukt. Sie bevorzugt einseitig die Sprache der herrschenden bzw. der bürgerlichen Schicht. Insofern sie andere Zugangsweisen gar nicht mehr berücksichtigt, wirkt sie normativ. Sollte sich das nicht ändern, wird mit dem Vordringen künstlicher Intelligenzen auch unsere ästhetische Erfahrung in diesem Sinn geformt.

Trivia

Heute gibt es die im Gemälde von Pissarro gezeigte Kultur nicht mehr. Vor allem Montmartre ist zur Unterhaltungsmaschinerie für Tourist:innen geworden, die dorthin reisen, weil vor 120 Jahren sich dort Künstler:innen trafen. Ähnliches gilt für das frühere Künstlerviertel Montparnasse. Die von Pissarro gezeichnete Bar gibt es aber immer noch, seit über 120 Jahren am selben Ort in wiedererkennbarer Ausstattung: 42 Rue du Montparnasse, 75014 Paris lautet die Adresse. Das ist nur 200 Meter vom berühmten Café de la Rotonde entfernt, in dem Picasso und Modigliani verkehrten. Das waren damals die goldenen Zwanziger.

Wie sieht das heutige Falstaff aus? Selbst dort, wo es noch unverkennbar Anklänge gibt, dominiert dennoch der touristische Aspekt. Der Tresen wurde verlängert, anstelle von Spiegeln flimmern nun LCD-Fernseher an der Wand. Das Falstaff in Mont­parnasse serviert heute belgisches Bier, Künstler:innen und Lebewelt findet man dort nicht mehr. Aber dennoch ist die Geschichte immer noch wahrnehmbar – hoffen zumindest die Besucher:innen.


Anmerkungen

[1]    Mertin, Andreas (2023): Kunst oder bloß kulturelles Kapital? Die feinen Unterschiede – ein immer noch aktuelles Thema. In: tà katoptrizómena - Magazin für Kunst | Kultur | Theologie | Ästhetik, Jg. 25, H. 143. Online verfügbar unter https://www.theomag.de/143/am791.htm

[2]    Bourdieu, Pierre (2000): Die feinen Unterschiede. Kritik der gesellschaftlichen Urteilskraft. Frankfurt am Main

[3]    Noch lustiger, ja fast schon kreativ ist es eigentlich, dass die KI die als Falstaff identifizierte Figur auf dem Gemälde dann nach der literarischen Figur beschreibt: „Der Mann in der Mitte, vermutlich der Namensgeber Falstaff, ist beleibt und trägt ei-nen auffälligen grünen Anzug. Er hält ein Glas in der Hand und lacht herzlich.“

[4]    Bei Falstaff handelt es sich um Es handelt sich um einen wohlbeleibten, trink- und raufsüchtigen Soldaten.

Artikelnachweis: https://www.theomag.de/143/am792.htm
© Andreas Mertin, 2023