GPT-4o spielt „Black Myth Wukong“! Die KI „Ma Men“ kann den Boss mit einer übermenschlichen Gewinnrate kontrollieren
Ist das Spiel „Black Myth: Wukong“ nur ein Monster?
Ich gebe zu, als mein Freund mich in diesem Moment auf diese Weise befragte, verlor ich meine Wachsamkeit.
Von der Erkenntnis, dass Yang Jian gefangen werden muss, bis zum Tod von Tiger Vanguard hat es nur weniger als einen halben Tag gedauert. Wenn wir „Black Myth“ klären wollen, können wir dann auf KI zählen?
Rollen und ausweichen, Abstand halten und die Bewegungen des Monsters klar im Blick behalten.
Als die Zeit gekommen war, schwang der Mann des Schicksals plötzlich seinen schweren Stock.
Mithilfe der Kraft der KI wurde eine Reihe seidiger Combos ausgeführt und der Boss wurde besiegt, ohne dass er sich wehren konnte.
Das Alibaba-Forschungsteam hat kürzlich ein VARP-Agent-Framework vorgeschlagen. Und dieses KI-„Pferd“ wurde von ihnen gemacht.
Man kann sagen, dass es sich nicht um ein Plug-In handelt, aber es ist besser als ein Plug-In.
Die GPTs, die dem Großen Weisen gegenüberstanden, waren wirklich nicht schlimmer als Menschen.
KI, die sich dem Großen Weisen stellt, ist eigentlich gar nicht so kompliziert.
Traditionell verlässt sich die Spiel-KI auf Spiel-APIs, um Umgebungsinformationen und ausführbare Aktionsdaten zu erhalten. Das Problem besteht jedoch darin, dass nicht jedes Spiel bereit ist, eine offene API bereitzustellen, oder selbst wenn eine solche bereitgestellt wird, fehlen einigen APIs die Grundlagen, was es schwierig macht, den tatsächlichen Anforderungen gerecht zu werden.
Darüber hinaus haben herkömmliche Methoden immer das Gefühl, dass etwas fehlt, und können das reale Spielerlebnis menschlicher Spieler nicht vollständig simulieren.
Auf dieser Grundlage schlug das Alibaba-Forschungsteam ein neues VARP-Agenten-Framework (Vision Action Role-Playing) vor.
Nach Erhalt der Eingabe-Screenshots des Spiels führt das VARP-Agent-Framework mithilfe einer Reihe von VLMs eine Inferenz durch und generiert schließlich Code in Python-Form, um den Spielcharakter zu steuern, einschließlich einer Kombination aus einer Reihe atomarer Befehle wie leichter Angriff, Vermeidung und schwerer Angriff , und die Genesung wartet.
VARP enthält drei Wissensbasen: Situationsbasis, Aktionsbasis und menschliche Führungsbasis sowie zwei Systeme: Aktionsplanungssystem und menschliches Führungsbahnsystem.
Einfach ausgedrückt entspricht das Aktionsplanungssystem einem Bibliothekar, der dafür verantwortlich ist, die am besten geeigneten Materialien aus der Situationsbibliothek und der aktualisierbaren Aktionsbibliothek zu finden.
Das System wählt oder generiert Aktionen, die zur aktuellen Situation passen, basierend auf den eingegebenen Spiel-Screenshots, und dann werden diese Aktionen und Situationen in diesen beiden Bibliotheken gespeichert oder aktualisiert.
Das vom Menschen gesteuerte Flugbahnsystem nutzt menschliche Betriebsdatensätze, um die Leistung von VARP bei komplexen Aufgaben wie Wegfindungsaufgaben und schwierigen Kampfaufgaben zu verbessern.
In der Aktionsbibliothek stellt „def new_func_a()“ eine neue Aktion dar, die vom Aktionsplanungssystem generiert wird, und „def new_func_h()“ stellt eine neue Aktion dar, die vom menschlich geführten Trajektoriensystem generiert wird. „def pre_func()“ stellt eine vordefinierte Aktion dar.
In dem oben erwähnten Spiel „Black Myth Wukong“ stellte das Forschungsteam 12 Aufgaben, von denen 75 % Kämpfe beinhalteten, und führte Benchmark-Tests mit VLMs durch, darunter GPT-4o, Claude 3.5 Sonnet und Gemini 1.5 Pro.
Die Ergebnisse zeigen, dass VARP bei einfachen Aufgaben und einfachen bis mittelschweren Schlachten eine Gewinnquote von bis zu 90 % aufweist. Bei schwierigen Aufgaben lässt die Leistung von VARP jedoch leicht nach, und das Gesamtniveau ist immer noch nicht so gut wie das menschlicher Spieler.
Wenn der VARP-Agent außerdem Entscheidungen im Spiel verarbeitet, kann er nicht jeden Spielrahmen (d. h. Spielbildschirm) in Echtzeit analysieren, da er auf die Inferenzgeschwindigkeit des visuellen Sprachmodells (VLM) angewiesen ist.
Mit anderen Worten: Es kann nicht wie ein menschlicher Spieler nahezu augenblicklich auf alles reagieren, was auf dem Bildschirm passiert. Stattdessen kann es das Spielmaterial nur alle paar Sekunden verarbeiten und einige wichtige Frames (Keyframes) für die Analyse und Entscheidungsfindung auswählen.
Als „Black Myth: Wukong“ auf den Markt kam, wurde es dafür kritisiert, dass es keine klare Karte und eine große Anzahl von „Luftwänden“ habe. Daher wäre die KI ohne die Hilfe von Forschern nicht in der Lage, sie zu finden der Chef.
Generative KI hat das Feuer der Weltveränderung entfacht, und bevor sie ins öffentliche Bewusstsein gelangte, entstand die intuitivere Bindung der einfachen Menschen zur KI möglicherweise größtenteils aus Spielen.
KI ist in der Geschichte der Videospiele wichtiger als wir denken
Viele Menschen hätten vielleicht nicht gedacht, dass eines der ersten Spiele, das auf den KI-Zug aufsprang, das klassische Arcade-Spiel „Pac-Man“ sein würde.
Voraussetzung für den Sieg des Spielers ist es, alle Bohnen im Labyrinth zu essen, und die scheinbar albernen bunten Geister haben unterschiedliche Verfolgungsalgorithmen und verfolgen den Spieler auf unterschiedliche Weise und auf unterschiedliche Weise.
Die Algorithmenbewegungen jedes Geistes sind extrem einfach und es mangelt ihnen an Lernfähigkeit. Sobald der Spieler diese Regeln versteht, wird der Schwierigkeitsgrad des Spiels drastisch sinken.
„Metal Gear Solid“ im Jahr 1987 markierte einen weiteren wichtigen Meilenstein in der Spiele-KI.
Die KI-Charaktere im Spiel begannen, komplexere Verhaltensmuster zu zeigen, und zum ersten Mal wurde ein feindseliger Reaktionsmechanismus gegenüber Spielern eingeführt. Wenn der Spieler in diesem Spiel vom Feind entdeckt wird, löst der Feind das Alarmsystem aus, ruft Verstärkung an, ändert die Patrouillenrouten und stellt sogar Fallen auf.
Wenn der Entwicklungsprozess von KI und Spielen später in einer Reihe bahnbrechender Ereignisse kurz aufgeführt wird, sieht er ungefähr wie folgt aus:
- 1997 besiegte IBMs „Deep Blue“ den menschlichen Weltmeister in einem Schachspiel und markierte damit einen großen Durchbruch für die KI in Schachspielen.
- Im Jahr 2004 wurde „Half-Life 2“ veröffentlicht. Die KI-Charaktere im Spiel waren in der Lage, komplexere Entscheidungen und Interaktionen zu treffen, was die Immersion des Spiels verbesserte.
- Im Jahr 2011 besiegte IBMs „Watson“ den menschlichen Champion in der Quizshow „Jeopardy!“ und demonstrierte damit die Fortschritte der KI in der Verarbeitung natürlicher Sprache und beim Wissensdenken.
- Im Jahr 2016 besiegte AlphaGo Lee Sedol im Go-Spiel und markierte damit einen großen Durchbruch für die KI in komplexen Strategiespielen.
- Im Jahr 2018 wurde „Red Dead Redemption 2“ veröffentlicht. Der Grad der Interaktion zwischen den KI-Charakteren des Spiels und der Umgebung wurde erheblich verbessert und sorgte für ein äußerst realistisches Spielerlebnis.
- Im Jahr 2020 führte NVIDIA die DLSS-Technologie ein, die KI nutzt, um die Grafikwiedergabe zu beschleunigen und die Spieleleistung und Bildqualität zu verbessern.
Wenn man sich die aktuelle Spielumgebung ansieht, liegt der Schwerpunkt des Spiels immer noch auf der Kameradschaft, und die KI ist wie ein Verstärker, der diese Kameradschaft unzählige Male verstärkt.
Auf der diesjährigen CES nutzte Nvidia die Avatar Cloud Engine (ACE), um Spiele-NPCs „lebendig“ zu machen, und erlangte in der Branche große Popularität.
In einer Demo namens Kairos konnten Spieler mit Jin, einem Ramen-Ladenbesitzer, interagieren. Obwohl Jin nur ein NPC ist, beantwortet er mithilfe generativer KI Fragen wie ein echter Mensch.
Die Kombination von KI und Gaming war schon immer eine Kombination aus Hassliebe.
Nehmen wir als Beispiel Wettbewerbsspiele. In der Vergangenheit bestand die Methode lediglich darin, den Schwierigkeitsgrad streng anzupassen. Heute besteht die Methode darin, menschliche Vorgänge zu imitieren, um das Spielerlebnis realistischer zu gestalten.
Befürworter glauben, dass, wenn eine menschensimulierende KI zum Gegner oder Teamkollegen wird, dies aufgrund des Mangels an echten Spielern wiederum das Wettbewerbsgefühl des Spiels verbessern kann.
Dies ist auch der Nachteil, dass die Bindungsrate der Spieler verbessert wurde, aber unter der Kontrolle des Systems können sich die Spieler dem Strudel der Manipulation durch die KI nicht entziehen.
In der Anfangsphase gab es kühne Worte, in der Mittelphase gab es Unsinn und in der späteren Phase herrschte Stille.
Wenn wir die ganze Nacht wach bleiben, nur um ein weiteres Spiel zu gewinnen, ist es schwer zu sagen, ob wir das Spiel spielen oder das Spiel uns spielt. Besonders wenn man erkennt, dass es sich bei den Teamkollegen möglicherweise um KI handelt, ist das Gefühl der Ohnmacht wie ein Schlag mit der Faust auf die Baumwolle.
Mein Herz fühlte sich weich an und hatte keinen Fokus.
Alter Huang-Prophet! Werden zukünftige Spiele von KI generiert?
Sogar ein Programmieranfänger kann KI zum Spielen nutzen.
Vor ein paar Jahren hätte man sich das wahrscheinlich nur in Träumen vorstellen können, aber die Einführung der generativen KI hat all dem echten Raum für die Umsetzung gegeben.
Im kleineren Maßstab ist es so, als würde man GPTs erstellen und Geschichten erzählen. Im größeren Maßstab ist es ein kleines, mit KI-Unterstützung erstelltes Programm. Obwohl die Interaktivität nicht so interessant ist, ist sie besser als die schöne und reichhaltige Grafik.
Geht man noch einen Schritt weiter, könnten in Zukunft sogar Spiele auf 3A-Meisterwerksniveau direkt durch KI-Rendering generiert werden.
Letztes Jahr sagte Nvidia-Gründer Jensen Huang voraus, dass jedes Pixel in zukünftigen Spielen generiert und nicht gerendert wird. Als dies damals gesagt wurde, waren vielleicht noch alle zögerlich, aber mittlerweile haben immer mehr Forschungsergebnisse die Möglichkeit dieser Umsetzung gefunden.
Normalerweise kann es eine Woche dauern, eine Umgebung für ein kleines Spiel zu erstellen, und länger für ein Studioprojekt, abhängig von der Komplexität des Designs.
Letzten Monat kündigte Google DeepMind seine erste „KI-Spiele-Engine“ GameNGen an.
Es kann den Schießspielklassiker „Doom“ in Echtzeit mit einer Geschwindigkeit von mehr als 20 Bildern pro Sekunde auf einem einzigen TPU-Chip simulieren. Dabei wird ein Diffusionsmodell verwendet, um jeden Frame in Echtzeit vorherzusagen. Das bedeutet, dass jeder Moment im Spiel in Echtzeit generiert wird, basierend auf den komplexen Interaktionen der Aktionen des Spielers und der Umgebung.
Damals musste der leitende NVIDIA-Wissenschaftler Jim Fan seufzen, dass „Doom“, das von Hackern an verschiedenen Orten wild betrieben wurde, tatsächlich in einem reinen Diffusionsmodell implementiert wurde und jedes Pixel generiert wurde.
Später tauchen weitere ähnliche Ergebnisse auf.
Vor nicht allzu langer Zeit hat auch Tencent einen großen Schritt gemacht und ein großes Modell speziell für AAA-Open-World-Spiele auf den Markt gebracht – GameGen-O.
GameGen-O ist nicht einfach. Es kann Charaktere, dynamische Umgebungen und komplexe Aktionen in verschiedenen AAA-Spielen wie „The Witcher 3“, „Cyberpunk 2077“, „Assassin’s Creed“ und „Black Myth: Wukong“ simulieren Auch die Qualität der Spielszenen ist sehr hoch.
Um den Datensatz aufzubauen, sammelte Tencent, das viel Geld ausgab, mehr als 32.000 Spielvideos, jedes Video war nur ein paar Minuten oder so lang wie ein paar Stunden, und wählte dann 15.000 verfügbare Videos durch manuelle Daten aus Anmerkung.
Diese kuratierten Videos werden durch Szenenerkennung in Segmente geschnitten und dann streng nach Ästhetik, optischer Flussanalyse und semantischem Inhalt sortiert und gefiltert.
Electronic Arts, ein amerikanischer Spieleentwickler, zeigte der Branche kürzlich mit einem „From Imagination to Creation“-Video eine glänzende Zukunft für KI in der Spieleentwicklung auf.
Im Video können Spieler mithilfe von KI-Tools mit nur einfachen Anweisungen Spielszenen, Charaktere und andere Inhalte erstellen.
CEO Andrew Wilson sagte, dass generative KI in Zukunft mehr als die Hälfte der Entwicklungsprozesse des Unternehmens verbessern kann und voraussichtlich innerhalb von drei bis fünf Jahren größere, immersivere Spielwelten entwerfen und erschaffen wird.
KI kann nicht nur die Entwicklungseffizienz bestehender Spiele verbessern, sondern möglicherweise auch neue Spielerlebnisse schaffen.
Vielleicht werden Sie sagen, dass egal, welche fortschrittliche Technologie im Spiel verwendet wird, letztendlich der Spaß das Wichtigste ist.
Aber da sich GTA 6 immer wieder verzögert und keine Spur mehr übrig ist, kommen wir vielleicht auch auf die Idee, es selbst zu machen und genug Essen und Kleidung zu haben.
Schließlich würde es sich ziemlich gut anfühlen, wenn ich in Zukunft persönlich eine „Sin City“ erschaffen könnte.
# Willkommen beim offiziellen öffentlichen WeChat-Konto von aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich zur Verfügung gestellt.
Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo