Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - cover.001

In der ersten Hälfte dieses Jahres werden die Agent-Tools mit größter Spannung erwartet und versprechen viel: Diese hirnzermürbenden, sich wiederholenden und zeitraubenden Aufgaben des täglichen Lebens können jetzt einfach durch Bewegen Ihrer Finger und Eintippen einiger Eingabeaufforderungen erledigt werden.

Der Kuchen ist wirklich verlockend, aber denken Sie sorgfältig darüber nach: Wenn Sie wirklich nützlich sein möchten, benötigen Sie eine Denkweise und Planung, die der von Ihnen und mir ähnelt, und sogar die Fähigkeit, mit sich selbst zu konkurrieren und über sich selbst nachzudenken.

Vor diesem Hintergrund haben wir den neuesten MiniMax Agent einer gründlichen Testrunde unterzogen. Dabei haben wir uns nicht mehr mit Bewertungen auf Einstiegsniveau zufrieden gegeben, sondern ihn einigen interessanten und herausfordernden, aber dennoch realistischen Arbeitsszenarien unterzogen, um zu sehen, wie intelligent er sein kann.

Über MiniMax Agent kann ich nur eines sagen: Sie können Ihre Arbeit erledigen, während Sie spielen.

Kreativer Inhalt: Visuelle Erzählung jenseits der Vorstellungskraft

MiniMax selbst verfügt über umfassende Erfahrung mit multimodalen Modellen und dieser Vorteil ist für diejenigen, die kreative Arbeiten erstellen möchten, sehr nützlich.

Labubu erfreute sich in letzter Zeit großer Beliebtheit, sodass wir einen Werbeplan für Labubu erstellen mussten. Es klingt kompliziert, aber dieser Agent geriet überhaupt nicht in Panik. Er entwickelte zunächst einen umfassenden Werbestrategieplan, legte die Liste der zu erbringenden Leistungen fest, erstellte geordnet Plakate und bereitete diese dann Schritt für Schritt vor.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - labubu1

Während des gesamten Prozesses nutzt MiniMax Agent sein Gehirn zum Denken und greift dabei auf geeignete Tools zurück, sodass alles reibungslos und geordnet abläuft.

Die Ergebnisse waren eine echte Überraschung: Nicht nur die visuelle Ästhetik war online, auch der Einführungstext war klar formuliert, und es gab eine Reihe von Themenpostergalerien nach der anderen. Es stellte sich heraus, dass MiniMax Agent nicht nur die Aufgabe bewältigen kann, sondern auch ein gewisses „Geschmackserlebnis“ hat.

Ebenso können Sie Labubu weiterhin als Protagonisten verwenden und MiniMax Agent ein 20-seitiges Bilderbuch schreiben lassen.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - labubu2

In etwas mehr als zehn Minuten hat MiniMax Agent in drei Schritten Zeichnung + Story-Schreiben + Webseiten-Layout abgeschlossen.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - labubu3

Die Wirkung ist unerwartet hervorragend, die Zeichenbilder sind relativ konsistent, der Text und die Bilder auf jeder Seite sind nicht oberflächlich, es ist sinnvoll zu lesen und nicht langweilig. Es unterstützt auch die Webbereitstellung, das Layout ist vernünftig und die Details sind exquisit.

Natürlich gefällt es mir besser, wenn Labubu den Spitznamen „Kleiner Hasenhutbär“ erhält. Das klingt süß und ist optisch ansprechend. Mit Bildern und Text ist es sowohl für Kinder als auch für Erwachsene geeignet.

PPT-Produktion: nicht nur schön, sondern auch „schnitzen“

Eines der Highlights dieses Updates ist die Möglichkeit, schöne PPTs zu erstellen, eine Notwendigkeit für Berufstätige.

Für MiniMax Agent ist PPT auch eine Art Multimodalität. Es sieht aus wie nur Bilder und Texte, aber egal ob es um Satz, Inhaltsplanung und -organisation geht, es muss ein Thema, Ideen und eine Logik haben und in der Lage sein, den Inhalt unabhängig zu vervollständigen.

Entwerfen Sie beispielsweise eine PPT zur Erklärung physikalischer Phänomene für Schüler der Mittelstufe:

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - physics ppt

Oder ein Geschäftsbericht für Investoren:

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - Cola

Einfach ausgedrückt geht es bei der Erstellung einer guten PPT nicht nur um die einfache Suche nach Informationen, sondern auch um einen Test der Fähigkeit zur Filterung, Rauschunterdrückung und domänenübergreifenden Korrelation von Informationen.

Die fertigen Produkte sehen alle großartig aus, was die Frage aufwirft: Was hat MiniMax Agent während des Produktionsprozesses gemacht?

Wir haben einen Test mit Marktforschungs-PPTs durchgeführt, die in der Regel daten- und informationsintensiv sind. Dies war eine gute Gelegenheit zu prüfen, wie gut die PPTs die Daten verstanden, geeignete Diagramme auswählten und die Ergebnisse präsentierten.

Erstens kann es Aufgaben präzise aufteilen und Inhalte entsprechend der dreischichtigen Struktur „Seitenlayout + Diagrammtyp + Datenstil“ organisieren, und die Seitenplanung ist sehr gut.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - ppt4

Die Visualisierung stellt nicht nur die wichtigsten Datenpunkte vollständig dar, sondern verwendet auch geeignete Visualisierungsmethoden, um sie entsprechend den unterschiedlichen Merkmalen der Daten anzuzeigen. Der Animationsübergang der gesamten PPT ist ebenfalls sehr flüssig und hebt die wichtigsten Punkte auf natürliche Weise hervor, sodass sogar der Aufwand für die Feinabstimmung der Animation gespart wird.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - ppt3

In der finalen Lieferung wurden neben den benötigten PPT-Dokumenten auch zusätzliche Web- und PDF-Dateien sowie Markdown-Dateien bereitgestellt.

Insgesamt verfügt der Minimax-Agent über sehr gute Fähigkeiten in der gesamten Kette „Verstehen-Integration-Argumentation-Generierung-Ausdruck“, insbesondere in den Bereichen Nicht-Code, Texterstellung und Geschäftsanalyse, und kann uneingeschränkt als „professionell“ bezeichnet werden.

Von Audio zur Website: Ein intelligenter Content-Workflow aus einer Hand

Wenn die Bilder und Texte nicht ausgereift genug sind, folgt eine Szene, die die Fähigkeiten des Agenten noch mehr auf die Probe stellt: Diese Aufgabe erfordert die Konvertierung des Formats der hochgeladenen Audiodatei und die anschließende Umwandlung in ein Transkript mit Zeitstempel. Abschließend muss basierend auf dem Inhalt eine Mindmap erstellt werden.

Für sich genommen sind diese Aufgaben nicht schwierig, die Schwierigkeit besteht jedoch darin, sie gemeinsam zu erledigen.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - audio1

Früher mussten wir uns entweder mit den Konvertierungstools vertraut machen oder zeitaufwändig verschiedene Online-Konvertierungstools suchen und ausprobieren. MiniMax Agent erledigt dies direkt intern, was uns den Aufwand für die Suche, Installation und Bedienung externer Tools erheblich erspart.

MiniMax Agent ist während des gesamten Prozesses hocheffizient und komfortabel. Besonders intuitiv ist die nahtlose Formatkonvertierung. Im Prozessfenster sehen Sie, dass MiniMax Agent schnell und präzise Transkripte erstellt.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - audio 2

Sie können nicht nur Audioinhalte in Text umwandeln, sondern auch ein tiefes Verständnis der Audioinhalte erlangen, was sich in der bereitgestellten Mindmap widerspiegelt.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - audio3

Mindmaps können nicht nur die Kernideen und den logischen Kontext des Audios klar herausarbeiten, sondern auch die Hierarchie und die wichtigsten Informationspunkte des Inhalts präzise erfassen.

Dies geht weit über die einfache Schlüsselwortextraktion hinaus und demonstriert die leistungsstarke Fähigkeit von MiniMax Agent, verstreute Informationen zu strukturieren und zu visualisieren.

Obwohl ich die Anforderungen angegeben hatte, wusste ich eigentlich nicht, wie ich sie umsetzen sollte. Stattdessen ergriff es die Initiative und organisierte die Arbeit selbst: Von der Installation der Abhängigkeitspakete bis zum Starten des Servers erledigte es die Arbeit selbstständig und ohne Probleme.

UI-Design: Lernen durch Handeln, effiziente Ausgabe

Wenn wir tatsächlich zu unserer täglichen Arbeit zurückkehren, müssen die folgenden Schritte durchgeführt werden: Recherchieren und Verstehen – Lernen und Begreifen – praktisches Üben. Dies ist der grundlegendste Arbeitsprozess für den Menschen. Denn ohne Forschung gibt es keine Ideen.

Wenn Sie also ein guter Agent sein möchten, ist dieser Prozess ebenfalls unerlässlich – er ist kompliziert, aber notwendig.

Die folgende Fallstudie untersucht die Implementierung des gesamten Prozesses: Untersuchen Sie den Designstil des Liquid Glass von Apple iOS 26 und erstellen Sie eine ähnliche Benutzeroberfläche.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - apple

Offensichtlich war sich auch MiniMax Agent bewusst, dass dies eine ziemlich komplizierte Aufgabe war und erstellte einen kompletten Arbeitsplan für sich.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - UI2

Der nächste Schritt besteht darin, schrittweise Code zu entwerfen, bereitzustellen und zu schreiben. Es sind viele Schritte, die jedoch geordnet und ohne menschliches Eingreifen ausgeführt werden – selbst bei der Suche nach visuell ansprechenden Materialien.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - UI3

Die endgültige Lieferung umfasst nicht nur ein Codepaket, sondern auch eine Website, auf der die Ergebnisse des gesamten Forschungsprozesses präsentiert und in verschiedenen Dimensionen visuell dargestellt werden.

Es gibt sogar einen eigenen Bereich für interaktive Erlebnisse, in dem Sie den Effekt einfach ausprobieren können – er übertrifft die Einstellungen der ursprünglichen Eingabeaufforderung bei weitem und erfüllt die Aufgabe mehr als erfüllt.

Die ursprüngliche Eingabeaufforderung ist eigentlich sehr einfach. Vergleicht man sie mit den endgültigen Ergebnissen, erkennt man , dass MiniMax Agent nicht nur die Fähigkeit besitzt, gründliche Recherchen durchzuführen und Aufgaben mit Code zu erledigen, sondern auch über ein „eigenes Verständnis“ der Aufgaben verfügt .

Tiefgründige Recherche: mehr als nur suchen, mehr schlussfolgern

Datenrecherche ist eine grundlegende Fähigkeit. Sie ist nicht schwierig, erfordert aber viel Sorgfalt – insbesondere bei Recherchen auf Basis aktueller Nachrichten sollte die Informationsbeschaffung so weit wie möglich ausgeweitet werden.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - deep research

Gemessen am Denkprozess und den Ergebnissen hat die Leistung des Agenten bei der Erstellung dieses Forschungsberichts die Erwartungen bei weitem übertroffen: Er hat nicht nur die strukturierte Informationsintegration abgeschlossen, sondern auch seine Argumentationsfähigkeit unter Beweis gestellt.

Im Bericht listet MiniMax Agent nicht einfach die Daten auf, sondern identifiziert den enormen Unterschied zwischen der Marktgröße „Top-down“ und „Bottom-down“ und präsentiert ihn als „wichtige Markterkenntnisse“.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - deepresearch1

Offensichtlich kann das bloße Auflisten von Informationen nicht als wirkliche „tiefgehende Recherche“ bezeichnet werden. Die Agenten müssen die Muster, Trends und kausalen Zusammenhänge hinter den Daten erkennen und daraus wertvolle „Erkenntnisse“ und „Kernansichten“ gewinnen – dies erfordert Denkfähigkeiten, die über das bloße Textabgleichen hinausgehen .

Zusammenfassung: Modell in der linken Hand, Agent in der rechten, MiniMax ermöglicht mir einen Blick darauf, wie die Zukunft intelligenter Agenten aussehen wird

Agent ist in diesem Jahr einer der heißesten Trends im Bereich KI. Alle reden über die Zukunft von Agent, aber es gibt tatsächlich nur wenige Tools, die Agent von einer Angeber-Demonstration und einem „fünf Minuten heißen“ Spielzeug in ein Tool verwandeln können, das die Produktivität verändern kann.

MiniMax, das über ein selbst entwickeltes Modell verfügt, hat sein eigenes Agent-Produkt auf den Markt gebracht und uns eine andere Art des Spielens gezeigt. Nach dem Testen haben wir auch ein neues Verständnis von Agent: Was das Agent-Erlebnis bestimmt, ist nicht nur das Modell selbst, sondern auch die unsichtbare Infrastruktur.

Ein Detail ist hier besonders erwähnenswert: Als unabhängiges Unternehmen ist MiniMax nahezu der einzige Hersteller, der vollständige Full-Modal-Funktionen bereitstellen kann.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - speech

▲ Das MiniMax-Sprachmodell Speech-02-HD belegte den ersten Platz in der Liste der Artificial Analysis Speech Arena

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - hailuo02

▲ Das MiniMax-Videomodell Hailuo 02 belegte den zweiten Platz auf der Liste der Artificial Analysis Video Arena

Die meisten Fähigkeiten des Agenten basieren auf der Modell-Engine und der Trend „Modell als Agent“ wird immer deutlicher.

An diesem Punkt werden die Vorteile von Modellunternehmen in KI-Anwendungen voll demonstriert. Da sie das zugrunde liegende Modell direkt steuern, können sie die Planungslogik effektiver optimieren, die Betriebskosten senken und ein Datenschwungrad für die autonome Iteration erstellen .

MiniMax ist hierfür ein typisches Beispiel. Mit der Verbesserung seiner eigenen Modellfähigkeiten werden die Betriebskosten des Agenten kontinuierlich optimiert und seine Leistung deutlich verbessert.

Durch den Aufbau von Labubu von 0 auf 1 gab mir MiniMax Agent einen Einblick in die Zukunft intelligenter Agenten - conclusion3

MiniMax hat heute das weltweit erste groß angelegte Inferenzmodell mit hybrider Architektur, MiniMax-M1, als Open Source veröffentlicht. Es unterstützt nativ eine Eingabelänge von 1 Million Token und die branchenweit längste Ausgabelänge von 80.000 Token. Die zur Generierung von 100.000 Token erforderliche Inferenz-Rechenleistung benötigt nur 25 % der Leistung von DeepSeek R1, was den Preis von Inferenzmodellen weiter reduziert hat.

Während andere Startups immer noch über die hohen Token-Kosten besorgt sind, konnte MiniMax die Agent-Betriebskosten systematisch senken, indem der Anteil seiner eigenen Modelle erhöht wurde, was für die Benutzer sehr wichtig ist, um ein kontinuierliches und stabiles Erlebnis zu haben.

Dies ist die ultimative Interpretation von „Minimieren Sie den Aufwand, maximieren Sie die Intelligenz“. Einfach ausgedrückt bedeutet es, mit minimalem Aufwand maximale Intelligenz zu erlangen.

Durch die Anordnung „Modell in der linken Hand, Agent in der rechten Hand“ kann MiniMax das beste Gleichgewicht zwischen technischen Möglichkeiten und Benutzerwert finden und verfügt tatsächlich über die Voraussetzungen, um sich in diesem Wettbewerb intelligenter Agenten hervorzutun.

Wir stehen an einem beispiellosen Wendepunkt: KI entwickelt sich von einem Werkzeug zu einer zusammengesetzten intelligenten Einheit mit „Gehirn, Sinnen, Händen und Füßen“ und eröffnet einen neueren und cooleren Vorstellungsraum für die Arbeit und das Leben der Zukunft.

#Willkommen beim offiziellen öffentlichen WeChat-Konto von iFanr: iFanr (WeChat-ID: ifanr), wo Ihnen so bald wie möglich weitere spannende Inhalte präsentiert werden.

iFanr | Originallink · Kommentare anzeigen · Sina Weibo