Was KI-kreierte Kunst wirklich für die menschliche Kreativität bedeutet

Lee Unkrich Malerei, als Siebtklässler einer der berühmtesten Animatoren von Pixar. Er starrt auf das Bild einer Lokomotive auf dem Bildschirm des ersten Computers seiner Schule. Eha, er denkt. Ein Teil der Magie lässt jedoch nach, als Lee erfährt, dass das Bild nicht nur erschien, als er nach einem „Zugbild“ fragte. Stattdessen musste es von fleißigen Leuten mühsam kodiert und gerendert werden.

Stellen Sie sich jetzt vor, wie Lee 43 Jahre später auf DALL-E stößt, eine künstliche Intelligenz, die Originalgrafiken basierend auf von Menschen bereitgestellten Eingabeaufforderungen erstellt, die buchstäblich so einfach sein können wie „Foto eines Zuges“. Während er Wörter eintippt, um Bild für Bild zu erstellen, Eha kehrt zurück. Nur dieses Mal verschwindet es nicht. “Ich fühle mich wie ein Wunder”, sagte er sagt. „Als die Ergebnisse herauskamen, stockte mir der Atem und meine Augen tränten. Es ist so magisch.“

Unsere Maschinen haben die Schwelle überschritten. Unser ganzes Leben lang waren wir davon überzeugt, dass Computer nicht in der Lage sind, wirklich kreativ zu sein. Doch plötzlich verwenden Millionen von Menschen eine neue Art von KI, um atemberaubende, nie zuvor gesehene Fotos zu erstellen. Die meisten dieser Benutzer sind nicht, wie Lee Unkrich, professionelle Künstler, und das ist der Punkt: Sie müssen es nicht sein. Nicht jeder kann wie ein Oscar-Preisträger schreiben, Regie führen und schneiden Das Spielzeugspiel 3 oder Kokosaber jeder ich kann Führen Sie einen KI-Bildgenerator aus und geben Sie eine Idee ein. Was auf dem Bildschirm erscheint, besticht durch Realismus und Detailtiefe. Also die universelle Antwort: Eha. Mit nur vier Diensten – Midjourney, Stable Diffusion, Artbreeder und DALL-E – erstellen KI-Menschen heute zusammen jeden Tag mehr als 20 Millionen Bilder. Mit einem Pinsel in der Hand ist künstliche Intelligenz zu einer Wow-Engine geworden.

Da diese überraschenden KIs ihre Kunst aus Milliarden von Fotos gelernt haben, die von Menschen aufgenommen wurden, dreht sich ihre Ausgabe darum, wie Fotos aussehen sollen. Aber weil sie außerirdische KI sind, die selbst für ihre Schöpfer im Grunde geheimnisvoll ist, strukturieren sie die neuen Gemälde auf eine Weise um, auf die kein Mensch kommen würde, und füllen Details aus, die die meisten von uns nicht über die Kunstfertigkeit verfügen, sich vorzustellen, geschweige denn über die Fähigkeiten, sie auszuführen. Sie können auch angewiesen werden, in Sekundenschnelle weitere Variationen von etwas zu erstellen, das uns gefällt, in jedem gewünschten Stil. Dies ist letztendlich ihr größtes Kapital: Sie können neue Dinge schaffen, die nachvollziehbar und verständlich, aber gleichzeitig völlig unerwartet sind.

So unerwartet sind diese neuen Bilder, die von künstlicher Intelligenz erzeugt werden, in der Tat, dass – in der stillen Ehrfurcht unmittelbar danach Eha– ein anderer Gedanke kommt fast jedem, der ihnen begegnet ist: Die von Menschenhand geschaffene Kunst muss inzwischen zu Ende sein. Wer kann mit der Geschwindigkeit, Billigkeit, Größe und, ja, wilden Kreativität dieser Maschinen mithalten? Ist Kunst nur eine weitere menschliche Aktivität, die wir Robotern überlassen sollten? Und die nächste offensichtliche Frage: Wenn Computer kreativ sein können, was können sie dann noch, was uns gesagt wurde, dass sie es nicht können?

Ich habe die letzten sechs Monate damit verbracht, KI zu verwenden, um Tausende von atemberaubenden Bildern zu erstellen, und habe nachts oft den Schlaf bei der endlosen Suche verloren nur noch eins mehr Schönheit im Code verborgen. Und nachdem ich die Ersteller, Power-User und andere Early Adopters dieser Generatoren befragt habe, kann ich eine sehr klare Vorhersage machen: Generative KI wird die Art und Weise verändern, wie wir fast alles entwerfen. Oh, und kein Künstler wird wegen dieser neuen Technologie seinen Job verlieren.

Das ist ein Nein eine Übertreibung, Bilder zu nennen, die mit KI generiert wurden gemeinsame Kreationen. Das ernüchternde Geheimnis dieser neuen Kraft ist, dass ihre besten Anwendungen nicht aus dem Tippen einer einzigen Zeile resultieren, sondern aus sehr langen Gesprächen zwischen Mensch und Maschine. Der Fortschritt für jedes Bild ergibt sich aus vielen, vielen Iterationen, Hin und Her, Umwegen und stunden-, manchmal tagelanger Teamarbeit – alles vor dem Hintergrund jahrelanger Fortschritte im maschinellen Lernen.

KI-Bildgeneratoren entstehen aus der Verbindung zweier separater Technologien. Das eine war eine historische Abstammung von neuronalen Deep-Learning-Netzwerken, die kohärente lebensechte Bilder erzeugen konnten, und das andere war ein natürliches Sprachmodell, das als Schnittstelle zur Bildgebungs-Engine dienen konnte. Die beiden wurden zu einem sprachgesteuerten Bildgenerator kombiniert. Die Forscher durchsuchten das Internet nach allen Bildern mit begleitendem Text, wie z. B. Bildunterschriften, und verwendeten Milliarden dieser Beispiele, um visuelle Formen mit Wörtern und Wörter mit Formen abzugleichen. Mit dieser neuen Kombination können menschliche Benutzer eine Reihe von Wörtern – den Prompt – eingeben, die das Bild beschreiben, nach dem sie suchen, und der Prompt generiert ein Bild basierend auf diesen Wörtern.

Leave a Comment