künstliche Intelligenz und Kreativität

KENNEN SIE DIESE FRAU?
Nein.

Diese Frau gibt es nicht. Darum hat sie keine Persönlichkeitsrechte. Das ist ideal für Werbeagenturen und das Ende der Werbefotografie. Mit Midjourney ist schon jetzt jedes Thema in jedem Stil umsetzbar. Die Möglichkeiten mit Text und immer ausgefeilteren Befehlen die Bildausgabe zu steuern werden immer umfangreicher. Es können auch Stile durch Auswahl von Kameras oder Objektiven im Detail erzeugt werden. Midjourney bietet eine ganze Parameter-Liste dafür an. Es ist allerdings nötig eine Menge Zeit und Interesse in die Materie zu investieren um hier gute Ergebnisse zu erzeugen. Und natürlich zählt am Ende die ästhetische Urteilskraft und das richtige Bild-Verständnis.

KANN MAN DAS
MIETEN?
Nein.
Dieses wunderbare Objekt gibt es leider nicht. Darum gibt es auch keine Bildrechte.

23-03-24 / Neu bei Midjourney ist auch die sogenannte „Character Consistancy“. Siehe links im Bild. Mit dem Befehl –cref kann ein Image in das Prompt eingebunden werden, das für eine konsistenten Charakter sorgt. Man kann sogar einen shortcut dafür einrichten. Mit dem Befehl /prefer option set und +one more bekommen wir das Feld value. In dieses tragen wir den internen Link zum Chrakter-Image ein. Im Feld option geben wir dem Charakter einen Namen. Mit dem Befehl –name können wir den Charakter dann in unser Prompt einbinden. Eine neue Möglichkeit über mehrere Bilder hinweg immer wieder die immer gleiche „Person“ in Szene zu setzen. Ideal für Comics oder Story Books. Desweiteren können jetzt auch Stile besser konsistent immer wieder gleich über verschiedene Szenen realisiert werden. Mit dem Befehl –serf kann ein Referenzbild zu einem Style geladen werden. Hier erklärt Nolan wie es geht. Außerdem gibt es einen neuen turbo-mode. Midjourney gibt gas.
KANN MAN
DIESER
ZEITUNG
VERTRAUEN?
Ja.

Diese Zeitung gibt es wirklich. Sie schreibt stets bestens recherchierte Artikel. Deshalb kommt sie auch fast ohne Bilder aus. Und wenn, dann werden diese direkt von dpa bezogen. Im Gegensatz zum Internet wird auf Papier immer die Wahrheit gedruckt. Das Internet merkt sich alles. Die Zeitung landet schon einen Tag später im Papierkorb. Was letztes Jahr in der Zeitung stand, weiß heute kein Mensch mehr. Das haptische Medium Zeitung vermittelt uns aber dadurch, dass wir es spüren können, unbewußt mehr Glaubwürdigkeit. Die Information in der Zeitung ist greifbarer. Vor allem für ältere Menschen.

WERDEN NUR
FOTOGRAFEN ARBEITSLOS?

Nein. The new Sora.

Sora ist das krasse Video Tool von Open AI, das gerade mit großem Tam Tam angekündigt wird. Über kurz oder lang wird auch im Video-, bzw. Film-Bereich das gleiche passieren wie bei den Bild-KI Tools. Sora ist ein generatives künstliches Intelligenzmodell, das von OpenAI entwickelt wurde und sich auf die Text-zu-Video-Generierung spezialisiert hat. Das Modell akzeptiert Textbeschreibungen, sogenannte Eingabeaufforderungen, von Benutzern und generiert kurze Videoclips, die diesen Beschreibungen entsprechen. Open AI ist auch das Unternehmen das hinter ChatGPT steht. Aber es gibt auch noch Pika Labs AI. Einen kostenlosen KI-Videogenerator, der Ihre Text- oder Bildaufforderungen in kurze, ansprechende Videos verwandeln kann. Langsam wird es unübersichtlich.

Version 6.0

Man kann mit Visual AI viel Schrott produzieren. Aber es geht auch anders.

06-01-24 / Midjourney hat eine neue Version und kann jetzt auch Text verarbeiten und korrekt darstellen. Insgesamt werden die Ergebnisse tatsächlich noch viel realistischer. Wir haben auch den Eindruck, dass es Prompts besser versteht. Es ist noch mehr darauf optimiert, die inneren Bilder der Sehnsüchte und Traumwelten zu liefern, die uns triggern. Für die Werbung eigentlich ideal. Es lassen sich fantastische Bilder mit schönen Menschen und stylischem Ambiente auf Knopfdruck generieren.

Aber es gibt auch neue Richtlinien zum Schutz der Persönlichkeitsrechte. Z.B. bei ChatGPT. So lassen sich nicht mehr so einfach Bilder von echten Personen, z.B. Politikern erstellen. Das soll Missbrauch bekämpfen. Die Bild-KI-„Maschinen“ werden Generatoren für Traumwelten. Positive wie negative. Das wird auch unser Verhältnis zur Realität verändern. Aber wie? Aber erst mal entsteht spätestens jetzt ein neues Berufsbild – der Prompt Engineer.

Künstliche Intelligenz Kreativität Design
Künstliche Intelligenz Kreativität Design
Künstliche Intelligenz Kreativität Design
Künstliche Intelligenz Kreativität Design
Künstliche Intelligenz Kreativität Design
Künstliche Intelligenz Kreativität Design
Künstliche Intelligenz Kreativität Design
Künstliche Intelligenz Kreativität Design
Künstliche Intelligenz Kreativität Design
Künstliche Intelligenz Kreativität Design
Künstliche Intelligenz Kreativität Design

V.6 kann …

…  jetzt auch mit Text umgehen.

V.6 kann …

… fantastische Landschaften kreieren.

V.6 kann …

… elegante Küchen designen.

V.6 kann …

… Urlaubsträume wahr werden lassen.

V.6 kann …

– jedes Bild vom Elend dieser Welt liefern.

V.6 kann …

… spannende Architektur präsentieren.

V.6 kann …

… Appetit machen.

V.6 kann …

… täuschend echt aussehen.

V.6 kann …

… spannende Reportagen liefern.

V.6 kann …

… Emotionen einfangen.

V.6 kann …

… schönen Kitsch abliefern.

Um allerdings zielgerichtete High-End Ergebnisse zu erhalten, müssen wir wissen, wie wir diese Midjourney effektiv entlocken können.

Sie haben Fragen zum Thema oder wollen unsere Hilfe in Anspruch nehmen

© dube⁺ / made with midjourney

Historie der Visual AI

2017 verkündete eine Oxford-Studie, dass in den nächsten 25 Jahren fast die Hälfte aller Jobs durch Computer und/oder KI ersetzt werden könnten. Kreative Berufe aber galten lange Zeit als durch KI unersetzbar. Jack Ma, Gründer von Alibaba, betonte 2018 in einem Interview, dass wir die Fertigkeiten fördern sollten, die nicht durch Maschinen ersetzt werden können: „Ich finde, wir sollten unseren Kindern […] Kunst beibringen – um sicher zu gehen, dass sie anders sind.“

20-10-23 / Dennoch wurde gerade im letzten Jahr deutlich, wie nahe die Künstliche Intelligenz in Form von bspw. DALL·E 2 kreativer Bildkomposition gekommen ist. Auf für jeden zugänglichen Portalen, wie DALL·E 2 von OpenAI oder Midjourney tummeln sich seitdem Interessierte und trainieren durch Ihre Versuche die Künstliche Intelligenz immer weiter. Durch dieses massenhafte Feedback der Nutzer lernt die KI genau das zu liefern, was die meisten von ihr erwarten. Es wimmelt von bekannten Bildwelten vor allem aus der Science-Fiction Spielewelt, dem Comic oder der künstlichen Instagram Welt. Aber auch andere, eher ungewöhnliche Stile, wie sie von bestimmten Künstlern oder Kameras erzeugt werden, können bereits ansatzweise umgesetzt werden. Und das immer realistischer.

Was hat das für Konsequenzen für Fotografen, Designer und die Marketingverantwortlichen in Unternehmen, Parteien und die Gesellschaft als Ganzes? Diese Frage wird immer drängender. Denn die Qualität der durch Künstliche Intelligenz errechneten Bilder wird ständig besser. Am Ende dieses Beitrags wagen wir einen Ausblick in die Zukunft. Bleiben Sie dran. Es lohnt sich.

Künstliche Intelligenz / Ist das echte Kreativität?

Die neurobiologische Definition von Kreativität wird oft so beschrieben: Kreativität ist die „Neuformierung von vorgegebenen Informationen“. Die meisten aktuellen KI-Angebote funktionieren als Text-zu-Bild-Technologien. Das heißt: Der Nutzer kann versuchen, durch bestimmte Beschreibungen und Befehle die KI so zu „füttern“, dass sie ihm das gewünschte Bild erzeugt. Die Künstliche Intelligenz weiß (durch das Training), dass viele Menschen, die ihr bestimmte Codes zukommen lassen, oft bestimmte Erwartungen haben. Sie liefert dann auch echte Varianten davon, die manchmal so unterschiedlich sind, dass man fast das Gefühl bekommt, sie hätte die beschriebene Szenerie/Situation tatsächlich verstanden.

In einem kurzen Aufriss von Prof. Dr. Andreas Koch, Vorgelegt von Bastian Kilper, wird erklärt wie neuronale Netze (KNN) nach dem Vorbild biologischer Lebewesen, kombiniert mit Deep Learning, künstliche Intelligenz erzeugen. Diese kann so vorhandenes neu kombinieren. Neue Kombinationen in neuronalen Netzen führen zu neuen originellen Ideen. Analog zu den Neuronen in unserem Gehirn. Auch wir als Künstler oder Designer schöpfen in Wirklichkeit nicht aus dem Nichts. Wir sind vorgeprägt und kombinieren zumeist auch nur neu. Aber was ist dann noch der Unterschied zur menschlichen Kreativität?

künstliche intelligenz kreativität und design

© dube⁺ / made with midjourney

Künstliche Intelligenz / Müssen wir uns fürchten?

Yuval Noah Harari oder auch Elon Musk warnen: Künstliche Intelligenz könnte dem Menschen in nicht allzu ferner Zukunft gefährlich werden. Was unterscheidet ihrer Meinung nach heutige Formen künstlicher Intelligenz von unserer menschlichen? Den Unterschied macht das „in unseren Leib integrierte Bewusstsein“. Als Säugetiere ist unsere Identität – unser ganzes Erleben – als intelligente, kreative Lebewesen untrennbar mit dieser Körper-Existenz verbunden. Deshalb verstehen wir nicht nur abstrakt, dass ein Sonnenuntergang ein oft erwünschtes, positives Bild ist. Sondern wir erleben dieses Bild als positiv (oder auch kitschig), weil wir zugleich alle Erlebnisse von Sonnenuntergängen unseres Lebens erinnern. Denn jede und jeder hat eine ganz einzigartige Historie und ein ganz eigenes Erleben (durch Genetik oder Epigenetik). Wir verstehen also dieses Bild als Situation nicht nur, sondern wir wissen genau, wie sich so ein Sonnenuntergang an einem lauen Abend am Meer anfühlt. Genau das ist der Grund, weshalb wir auch einen Willen haben. Wir wollen in den Urlaub fahren, auch wenn wir z.B. kein Geld mehr haben :-). Oder wir wollen eben ein Bild kreieren, um uns dann dieses in dem Bild manifestierte Gefühl über das Sofa zu hängen.

Erst wenn wir es schaffen, der Künstliche Intelligenz über z.B. Sensoren ein eigenes Körper-Erleben (Emotionen) und damit eine eigene Historie (Tod), also ein eigenes Bewusstsein zu geben, wird sie zu einem menschenähnlichen Akteur, der selbst etwas wollen kann. Der Menschheit entsteht dann allerdings, laut Harari, auch ein Konkurrent, der überlegen sein könnte. 

Nein.

Wir haben es also bei den Anwendungen künstlicher Intelligenz in den verschiedenen Bereichen bisher nur mit mehr oder weniger nützlichen Werkzeugen zu tun, die uns vieles einfacher und viele Abläufe schneller machen können. Wir sollten das alles, wo sinnvoll, als Kreative, Künstler, Designer nutzen. Das nötige Know-How dazu müssen wir uns selbst aneignen. Aber dadurch werden ja auch wieder neue Verknüpfungen direkt in unserem eigenen Hirn geschaffen. 🙂 Ist doch toll! Keine Angst: Es bleibt anstrengend, denn die Ansprüche der Nutzer/Kunden wachsen immer mit den Möglichkeiten. 

Konkrete Anwendungen

Aufgrund neuer Regeln für die Nutzer offizieller Visual Ai-Services werden solche Bilder wohl nicht mehr möglich sein. Die Persönlichkeitsrechte sollen geschützt und der Missbrauch verhindert werden.

© dube⁺ / made with midjourney

Auflösung

Mit dem der Upscale Funktion von Midjourney können jetzt auch so detailreiche und gut aufgelöste Bilder generiert werden, dass sie sich sogar für Print eignen.

Film

Bei den AI Magic Tools von app.runwayml.com lassen sich schon ganz annehmbare Filmsequenzen per „Text zu Film“ anfordern.

Medienrecht

Die KI wird auch mit Bildmaterial und mit Stilen von Illustratoren und Künstlern „gefüttert“. Inwiefern hier die Urheberrechte verletzt werden, ist noch völlig offen.

Der Designer der Zukunft ist Marken- und Marketing-Experte, Konzeptioner, Texter, Fotograf, Illustrator, Designer und Programmierer in Personalunion. 

Das Phänomen KI wird vor allem emotional im Sinne von Verlustangst diskutiert. Durch KI-Disruptionen werden jetzt vor allem die Unternehmen betroffen sein, die Angestellten Arbeit geben. Die KI ist nun das, was einstmals die Dampfmaschine für den Weber war, jetzt für den Freiberufler oder Angestellten! Nun geht es den Akademikern an den Kragen – den Banken, den Steuerkanzleien, den Anwälten, den Entwicklern und der Kreativbranche ganz allgemein – den Fotografen, Illustratoren, Schauspielern und Sprechern. Aber uns interessiert natürlich vor allem, wie Unternehmen durch den Einsatz der KI wettbewerbsfähiger werden können. Auch wir können durch die offensive Nutzung der KI unseren Kunden mehr in kürzerer Zeit anbieten. Der Designer der Zukunft ist Marken- und Marketing-Experte, Konzeptioner, Texter, Fotograf, Illustrator, Designer und Programmierer in Personalunion. 

Was kann das gesellschaftlich bedeuten?

Wenn wir diese Entwicklung auf der Zeitachse nach vorn projizieren, können wir, mit ein wenig Phantasie und etwas Hintergrundwissen zu den Gesetzen visueller Wahrnehmung und Psychologie, einiges zur Zukunft sagen.

Picture Superiority

Die sogenannte „picture superiority“ bezieht sich auf das Phänomen, dass Bilder eher in Erinnerung bleiben als Worte. Das wurde experimentell nachgewiesen. Zudem wissen wir als Werber, dass Bilder schneller, unterschwelliger und intensiver wirken als Texte, die wir uns ja erst erschließen müssen. Wir haben dieses Primat aus unserer evolutionären Geschichte geerbt.  Wir „glauben“ auch heute noch Bildern intuitiv schnell und unbewusst. Auch das ist ausreichend wissenschaftlich untersucht worden. Eine Headline zur Klimakatastrophe besorgt uns möglicherweise. Das dazugehörige Bild, an der Wasseroberfläche schwimmender, toter Fische schockiert uns aber als erstes – und nachhaltiger. Ob wir wollen oder nicht. Dieses Bild kann jetzt nicht nur aus dem Zusammenhang gerissen, sondern auch mit Optimierung der Schockwirkung errechnet worden sein. Für die fotografische Praxis kann das z.B. bedeuten, dass die analoge Fotografie auf echten Filmen, die nicht manipuliert werden können, wieder an Bedeutung gewinnt.

Die Karriere des Zweifels

Jeder wird spontan zustimmen, wenn wir es wagen pauschal zu formulieren, dass wir unsere heutige säkularisierte Welt auf Basis von Wissenschaft und Forschung historisch der Karriere des Zweifels zu verdanken haben. Im Alltag kann der Mensch aber nicht an allem zweifeln. Das ist viel zu anstrengend. Deshalb haben wir vor allem im letzten Jahrhundert und auch heute wieder eine starke Tendenz zum Glauben. Heute aber eben in Bezug auf Ideologien, Medien oder sogar „die Wissenschaft“. Schließlich sind wir ja alle so aufgeklärt. 😉 Je nach Ausrichtung unterstützen uns viele Medien in dieser negativen Tendenz. Denn das bringt ihnen viele Vorteile. Wir leben also weiterhin in einer Welt der Manipulation und der Sehnsucht nach endgültigen Wahrheiten. Die Diversifizierung der Medienwelt und die sozialen Medien haben aber auf der anderen Seite wiederum neue Zweifel am offiziellen Narrativ geschürt. Dieser Konflikt spitzt sich derzeit zu.

Die Vertiefung des Zweifels

In dieser Konstellation werden die neuen Möglichkeiten, visuelle Welten durch KI ohne großen Aufwand immer realistischer erzeugen zu können, das tiefe Gefühl des Zweifels weiter nähren. Nachdem es sich hierbei um eine unbewusste Informationsverarbeitung auf basaler, intrapsychischer Ebene handelt, wird uns der Zweifel regelrecht in die Knochen fahren. Das wird große gesellschaftliche Auswirkungen haben, über die wir hier nichts Wertvolles sagen können. Schließlich ist der Zweifel für unsere Gesellschaft/Kultur fundamental, aber eine Gesellschaft lebt auch vom Vertrauen.

Das Ende der Werbung, mal wieder

Diese Entwicklung wird sicher Arbeitsplätze kosten. Aber sie wird vor allem unsere Zielgruppen noch weniger empfänglich für unsere glatten oder künstlich aufgerauten (Tränendrüsen-) Werbewelten machen. Sämtliche Versuche der Manipulation, mit oder ohne Bildern, werden nicht mehr so erfolgreich sein. Weil insgesamt Glaubwürdigkeit im visuellen Bereich aber auch bezogen auf Kampagnen insgesamt verloren gehen wird. Trotzdem wollen wir weiterhin Spaß an Informationen, am Einkauf und Freude an Innovationen haben. Und der ästhetische Anspruch an die Produkte und an unsere Umwelt im Ganzen wird weiterhin steigen. Die Ära der Manipulationen mit Fokus auf Angst, rührende Geschichten und erlösende, glatte Zukunfts-Welten, in denen dann alles geregelt ist, könnte aber bald ein Ende finden. Weil diese Manipulationen ganz einfach auf einer tieferen Erfahrungs- und Erlebnis-Ebene, intuitiv noch weniger glaubhaft sein werden. Der evolutionär ererbte, intuitive Glaube an das, was wir sehen, wird sehr wahrscheinlich nachlassen.

Das sehe ich ein

Sehen ist für uns aber auch ein Synonym für Verstehen. Denn Sehen und Verstehen lassen sich für uns intuitiv nicht trennen. Deshalb „sehe ich etwas auch so“, wenn ich derselben Meinung bin. Oder ich „sehe etwas ein“, wenn ich überzeugt worden bin. Wir können also verstehen, dass wir uns auf Bilder, oder sogar unsere Augen, immer weniger verlassen werden können. Das kann man am Ende auch als Erkenntnisgewinn sehen.

© Dietrich Dube

Wo finde ich visual AI?

Der Name bildet ein Kofferwort aus dem kleinen animierten Roboter Wall-E aus dem gleichnamigen Film und dem spanischen Surrealisten Salvador Dalí. Das Programm nutzt künstliche neuronale Netzwerke, ⁣um Wörter als Input in Anordnungen von Pixeln als Output zu transferieren.

Midjourney wurde von David Holz, dem Mitbegründer von Leap Motion, gegründet. Die offene Beta-Phase begann am 12. Juli 2022.  Am 14. März 2022 startete der Discord-Server mit der Aufforderung, qualitativ hochwertige Fotos auf Twitter/Reddit zu posten, um das System zu trainieren.

Stable Diffusion ist ein kostenloses Deep-Learning-Modell für die Text-Bild-Erkennung, das 2022 veröffentlicht wurde. Es wird in erster Linie verwendet, um detaillierte Bilder auf der Grundlage von Textbeschreibungen zu generieren, kann aber auch für andere Aufgaben wie Inpainting, Outpainting und die Generierung von Bild-zu-Bild-Übersetzungen auf der Grundlage einer Textaufforderung verwendet werden.

Krea AI ist ein innovatives Design-Tool, mit dem Benutzer eine benutzerdefinierte KI mit ihren eigenen Bildern trainieren können, um sie an ihren eigenen Stil anzupassen. Das Tool ist besonders effektiv für Konzeptkunst, Architekturvisualisierung, Produktfotografie und vieles mehr.

RunwayML ist ein KI-Design-Tool zur Film-Generierung mit Text-to-Speech-, Bild-, 3D-Textur- und Farbkorrekturfunktionen sowie Bild-zu-Bild- und Sprache-zu-Text-Transkription. Es gibt eine kostenlose Version mit Basisfunktionen und Speicherplatz und eine kostenpflichtige Versionen mit erweiterten Funktionen.

Das neue Text-to-Video-Modell. Sora kann Videos bis zu einer Minute lang generieren und gleichzeitig die visuelle Qualität und die Einhaltung der Aufforderung des Benutzers beibehalten. Sora ist in der Lage, komplexe Szenen mit mehreren Charakteren, bestimmten Bewegungsarten und genauen Details des Motivs und des Hintergrunds zu erzeugen. Das Modell versteht nicht nur, was der Benutzer in der Eingabeaufforderung angefordert hat, sondern auch, wie diese Dinge in der physischen Welt existieren.

Pika Labs AI, der kostenlosen KI-Videogenerator, der Ihre Text- oder Bildaufforderungen in kurze, ansprechende Videos verwandeln kann. 

Die fortschrittlichste KI-Technologie, um eine wahnsinnig hochauflösende Upscaling zu erreichen. Nicht nur gehoben, verbessern und transformieren! Magnific kann so viele Details neu erfinden, wie Sie möchten, geleitet von Ihrer eigenen Eingabeaufforderung und Ihren eigenen Parametern!

Adobe Firefly, ein Produkt der Adobe Creative Cloud, ist ein generatives maschinelles Lernmodell, das im Bereich Design eingesetzt wird. Es befindet sich in der öffentlichen Betatestphase. Adobe Firefly wurde auf der Sensei-Plattform von Adobe entwickelt.

Und was sagen jetzt die dazu?

Wir sind eine inhabergeführte Kreativagentur in München mit zwei Verantwortlichen und stehen seit mehr als 15 Jahren für durchdachte, überraschende und inspirierte Kreativlösungen für Marken und Kampagnen. Ein Workflow ohne Umwege, Phrasen und ohne ständig wechselnde Ansprechpartner.

089 7857673-0

dube + partner / Kreativagentur für Marken und Design
Hofmannstraße 5 / 81379 München