KI kann viele Dinge tun, aber sie kann keine Spiele erstellen – oder sie noch nicht einmal spielen

Da sich die KI-Tools verbessern, werden wir immer wieder ermutigt, ihnen immer komplexere Aufgaben zu übertragen. LLMs können unsere E-Mails für uns schreiben, Präsentationen erstellen, Apps entwerfen, Videos erstellen, im Internet suchen und die Ergebnisse zusammenfassen und vieles mehr. Eine Sache, mit der sie jedoch immer noch große Probleme haben, sind Videospiele.

Bisher haben in diesem Jahr zwei der größten Namen im Bereich KI (Microsoft und Anthropic) versucht, ihre Modelle dazu zu bringen, Spiele zu generieren oder zu spielen, und die Ergebnisse sind wahrscheinlich viel begrenzter, als viele Leute erwarten.

Damit sind sie perfekte Beispiele dafür, wo generative KI derzeit wirklich steht – kurz gesagt: Sie kann viel mehr als zuvor, aber nicht alles.

Microsoft generiert Quake II

Bei der Generierung von Videospielen gibt es ähnliche Probleme wie bei der Erstellung von Videos – die Bewegung ist seltsam und morphartig, und die KI beginnt nach einer bestimmten Zeit den Kontakt zur „Realität“ zu verlieren. Der neueste Versuch von Microsoft, den jeder ausprobieren kann , ist eine KI-generierte Version von Quake II.

Ich habe es einige Male gespielt und es ist ein wirklich verrücktes Erlebnis, bei dem seltsame, schmutzige Feinde aus dem Nichts auftauchen und sich die Umgebung um einen herum verändert, während man sich bewegt. Mehrmals, wenn ich einen neuen Raum betrat, war der Eingang verschwunden, als ich mich wieder zu ihm umdrehte – und als ich wieder nach vorne blickte, waren die Wände verschwunden.

Das Erlebnis dauert nur ein paar Minuten, bevor es abbricht und Sie auffordert, ein neues Spiel zu starten – aber wenn Sie Pech haben, reagiert es möglicherweise schon vorher nicht mehr richtig auf Ihre Eingaben.

Es ist jedoch ein großartiges Experiment, und ich denke, dass es für mehr Menschen nützlich wäre, es zu sehen. Damit können Sie selbst erfahren, was die KI der Generation gut kann und wo ihre aktuellen Grenzen liegen. So beeindruckend es auch ist, dass wir überhaupt ein interaktives Videospielerlebnis erzeugen können, ist es schwer vorstellbar, dass irgendjemand diese Tech-Demo spielen und glauben könnte, dass das nächsteAssassin's Creed von KI erstellt wird.

Es gibt jedoch solche Gedanken und Annahmen, und das liegt vor allem daran, dass die Menschen derzeit nicht umhin können, von KI zu hören. Auch wenn Ihnen künstliche Intelligenz egal ist, wird sie Ihnen überall unter die Nase gehalten. Das Problem besteht darin, dass die Informationen, die der Durchschnittsbürger erhält, fast ausschließlich aus Marketing- und CEO-Kommentaren großer Technologiekonzerne bestehen, die von Nachrichtenpublikationen aufgegriffen werden.

Das bedeutet, dass sie übertriebene und widersprüchliche Behauptungen wie diese hören:

Es hat das Potenzial, einige der größten Probleme der Welt wie Klimawandel, Armut und Krankheiten zu lösen. ( Bill Gates )

Wahrscheinlich werden wir bei Meta und auch die anderen Unternehmen, die grundsätzlich daran arbeiten, im Jahr 2025 über eine KI verfügen, die praktisch eine Art mittlerer Ingenieur sein kann, den Sie in Ihrem Unternehmen haben und der Code schreiben kann. ( Mark Zuckerberg )

Der effektive Einsatz von KI ist heute eine grundlegende Erwartung eines jeden bei Shopify. Es ist heute ein Werkzeug für alle Berufe und wird immer wichtiger. Ehrlich gesagt halte ich es nicht für machbar, darauf zu verzichten, die Fähigkeit zur Anwendung von KI in Ihrem Handwerk zu erlernen. ( Tobi Lutke , CEO von Shopify)

Wir sind jetzt zuversichtlich, dass wir wissen, wie man AGI so aufbaut, wie wir es traditionell verstanden haben. Wir glauben, dass im Jahr 2025 die ersten KI-Agenten „in die Arbeitswelt eintreten“ und die Leistung von Unternehmen grundlegend verändern werden. ( Sam Altman , CEO von OpenAI)

KI ist gefährlicher als beispielsweise schlecht gemanagte Flugzeugkonstruktion oder Produktionswartung oder schlechte Automobilproduktion, in dem Sinne, dass sie das Potenzial hat – so gering man diese Wahrscheinlichkeit auch halten mag, aber sie ist nicht trivial –, sie hat das Potenzial zur Zerstörung der Zivilisation. ( Elon Musk )

Das ist alles ziemlich extrem, oder? Es wird uns sowohl retten als auch zerstören, es ist sowohl ein Allround-Werkzeug für Profis als auch ein Werkzeug, das Profis ersetzen wird – und anscheinend könnten wir schon in diesem Jahr AGI auf Science-Fiction-Niveau bekommen. Wenn das alles ist, was die Leute hören, erwarten sie ziemlich erstaunliche Dinge von diesen Tools und glauben, dass alle Büroangestellten ihre Tage damit verbringen, sich wie Star Trek-Charaktere mit ihren Computern zu unterhalten.

Allerdings sieht die Realität nicht so aus. Die Realität sieht aus wie ein trippiges, schmutziges Quake II mit für Feinde unverständlichen Formen. LLMs auf ChatGPT-Ebene waren im Jahr 2022 wirklich ein aufregender Durchbruch und es hat allen viel Spaß gemacht, damit herumzuspielen – aber für die meisten Anwendungen, die uns die große Technologie derzeit aufdrängt, ist die KI einfach nicht leistungsfähig genug. Die Genauigkeit ist zu niedrig, die Fähigkeit, Anweisungen zu befolgen, ist zu gering, die Kontextfenster sind zu klein und sie werden nur auf Internet-Unsinn trainiert, anstatt auf Wissen aus der realen Welt.

Aber die Entwicklung eines Videospiels ist ein ziemlich komplexes Ziel – schließlich braucht es ganze Menschenteams Jahre, um diese Dinge zu erstellen. Wie wäre es stattdessen mit Videospielen?

Claude „spielt“ Pokémon Rot

Nun, es stellt sich heraus, dass die Leute auch damit experimentieren. Anthropics neuestes Modell, Claude 3.7 Sonnet , spielt seit etwa zwei Monaten Pokémon Red auf Twitch und er leistet den besten Job, den ein LLM jemals beim Pokémon-Spielen gemacht hat. Eine kleine Einschränkung besteht jedoch darin, dass er immer noch meilenweit hinter dem durchschnittlichen 10-jährigen Menschen zurückliegt.

Eines der Probleme ist die Geschwindigkeit – Claude braucht Tausende von Aktionen über mehrere Tage hinweg, um beispielsweise durch den Viridian Forest zu gelangen.

Warum dauert es so lange? Das liegt nicht daran, dass er nicht weiß, wie man Pokémon-Kämpfe strategisch gewinnt – das ist tatsächlich der Teil, in dem er am besten ist. Das Navigieren durch die Umgebung und das Vermeiden von Bäumen und Gebäuden ist dagegen nicht so gut. Claude wurde nie für das Spielen von Pokémon ausgebildet und es fällt ihm nicht leicht, die Pixelkunst und deren Darstellung zu verstehen.

Für ihn ist es besonders schwierig, sich durch labyrinthartige Gebiete wie Mt. Moon zurechtzufinden, da es ihm schwerfällt, eine Karte des Gebiets zu erstellen und nicht zurückzugehen. Einmal blieb er so in einer Ecke stecken, dass er zu dem Schluss kam, dass das Spiel kaputt sei, und einen formellen Antrag stellte, das Spiel zurückzusetzen.

Er ist auch nicht gut darin, sich daran zu erinnern, was seine Ziele sind, welche Dinge er bereits ausprobiert hat oder an welchen Orten er bereits war.

Dafür gibt es einen ziemlich einfachen Grund: LLMs verfügen über ein endliches „Kontextfenster“, das als ihr Gedächtnis fungiert. Es kann nur eine begrenzte Menge an Informationen enthalten, und sobald Claude an die Grenze stößt, fasst er zusammen, was er hat, um Platz für mehr zu schaffen. So könnte eine Information wie „Viridian City besucht, jedes Gebäude betreten und mit jedem NPC gesprochen“ auf „Viridian City besucht“ reduziert werden – was Claude dazu veranlasst, zurückzugehen und zu prüfen, ob es in der Stadt noch mehr zu tun gibt.

Um es zusammenzufassen: Claude weiß nicht, wohin er geht, er läuft gegen Wände, verwechselt zufällige Gegenstände mit NPCs, vergisst, wo er war und was er zu tun versucht, und jede Entscheidung, die er trifft, erfordert Absätze und Absätze der Begründung. Das ist keine Kritik – beides sind spannende Experimente, die LLMs so weit wie möglich bringen.

Aber bei all dem Hype um KI erscheint es den Leuten wichtig, Demos wie diese zu sehen und sich selbst ein Bild über KI zu machen. Bestimmte Persönlichkeiten versuchen, das Narrativ voranzutreiben, dass wir kurz vor dem Höhepunkt stehen – dass KI innerhalb weniger Jahre selbst die klügsten Menschen übertreffen wird –, aber ich glaube nicht, dass sie es aufrichtig meinen, sie sind nur Verkäufer. Wir haben den Höhepunkt noch lange nicht erreicht, die ganze Sache fängt gerade erst an.