Beginnen Sie mit Button Space: einem KI-Praktikanten, der sich aktiv mit Ihnen „ausrichtet“.
Agent (intelligent) und MCP (Model Context Protocol) sind die heißesten Trends im KI-Bereich im ersten Halbjahr 2025.
Vor einigen Tagen hat auch Bytes Agentenprodukt „Button Space“ offiziell mit internen Tests begonnen.
Unter den zahlreichen Agentenprodukten bietet Kouzi Space zum ersten Mal einen „Planungsmodus“ – eine Agentenfunktion, die Schritt für Schritt mit Benutzern zusammenarbeiten, an wichtigen Schrittknoten pausieren und bestätigen und es Benutzern ermöglichen kann, Routen in Echtzeit zu korrigieren.
Das Button-Team ist offiziell davon überzeugt, dass die Zusammenarbeit zwischen Menschen und Agenten zu einem reibungsloseren Arbeitsmodell führen wird.
Interne Beta-Anwendung von Button Space
Auch Ai Faner bekam sofort den Button-Space-Einladungscode und probierte einige leicht fantasievolle Aufgaben aus.
Wir fungierten als PR-Direktor von „Hallo Lehrer, mein Name ist Klassenkamerad Er“ und baten die Praktikanten, die jüngsten Ereignisse in der öffentlichen Meinung zu analysieren, einen Bericht über die öffentliche Meinung zu erstellen, weitere Gegenmaßnahmen und Vorschläge bereitzustellen und dann eine Antworterklärung zu verfassen:
Eingabeaufforderung: Ich bin der PR-Direktor des Teams „Hallo Lehrer, mein Name ist Herr He“. Vor Kurzem kam es bei unserer Marke zu einem Vorfall in der öffentlichen Meinung. Bitte sammeln Sie Informationen, bewerten Sie die Auswirkungen des Vorfalls, verstehen Sie den Inhalt der Beschwerden der Internetnutzer und analysieren und extrahieren Sie die Fehler, die wir nach Ansicht der Internetnutzer gemacht haben, sowie die Richtung für Verbesserungen. Sie können Informationen über die Websites und Internetplattformen suchen, die Sie für geeignet halten. Anschließend wurde für mich ein Bericht über die öffentliche Meinung erstellt, der den Zeitplan, den Entwicklungskontext, die Reaktionen und Beschwerden der Internetnutzer sowie die Reaktionsstrategien zu diesem Vorfall in der öffentlichen Meinung umfassend darlegte. Der Bericht muss etwas ausführlicher sein, insbesondere um verschiedene Perspektiven auf Reaktionsstrategien zu bieten. Darüber hinaus benötige ich, dass Sie eine Antworterklärung erstellen, die auf Ihrer Antwortstrategie basiert und aufrichtig ist, sich der Verantwortung nicht entzieht und praktische Verbesserungsmaßnahmen enthält. Sie müssen den öffentlichen Meinungsbericht in eine Webseite und eine PDF-Datei und die Antworterklärung in ein normales Dokument umwandeln.
Diese Aufgabe scheint relativ einfach zu sein. Die Hauptaktionen sind Suche und Texterstellung, aber es erfordert auch professionelle Kenntnisse des Berichtserstellers in der öffentlichen Meinungsanalyse und die Fähigkeit, Medienberichte und Social-Media-Beiträge zu seriösen Berichten zu verfeinern und zu formatieren. Dies sind die Fähigkeiten eines Agentenprodukts in Bezug auf große Modelle.
Zusätzlich zu den Fähigkeiten eines groß angelegten Modells ermöglicht diese Aufgabe Button Space auch, „seine Fähigkeiten zu testen“ in Bezug auf Browser-/Computernutzung, Code, MCP und andere Fähigkeiten.
und Arbeitsstandards. Dies ist der Datenanalyseteil des erstmals erstellten öffentlichen Meinungsberichts:
Dies ist eine Bewältigungsstrategie, die von einem KI-Praktikanten geschrieben wurde:
Als „erster Entwurf“ entspricht diese Lieferung den Standards hinsichtlich des Detaillierungsgrades des öffentlichen Meinungsberichts, der logischen Gliederung, der Professionalität der Analyse und des Formats der Antworterklärung. Die spezifischen Details treffen möglicherweise nicht unbedingt auf ein reales Szenario zu, aber die generierten Ergebnisse geben zumindest Hinweise, die für die nächsten Schritte verwendet werden können.
Es ist erwähnenswert, dass sich die generierten Ergebnisse mehr auf Vorbestellungsereignisse wie „Plagiate von Open-Source-Projekten“ und „Tastatur, die selbst tippen kann“ zu konzentrieren schienen, da bei der Eingabe der Aufgabe das Konzept der „Zeitleiste“ erwähnt wurde. Und das ist nicht die Absicht unserer Mission.
Offensichtlich ist die Zielausrichtung unter Kollegen am Arbeitsplatz immer noch wichtig.
Wir können einfach das Planungsmodell von Button Space verwenden, um uns an diesem KI-Praktikanten auszurichten:
Nach der Ausrichtung ist nicht nur das Inhaltsziel korrekt, sondern auch der Datenteil des öffentlichen Meinungsberichts zeigt direkt den Vergleich der Anzahl der Fans, der „drei aufeinanderfolgenden Rate“ und der Abschlussrate an. Die Aussagekraft und Repräsentativität der Daten wurde erhöht:
Sie können auch diesen Link besuchen, um die vollständige Wiederholung der Mission anzusehen.
Anhalten und langsamer werden: KI-Arbeitspartner müssen lernen, sich „auszurichten“.
Den Testergebnissen von Aifaner zufolge liegt der größte Unterschied zwischen Button Space und herkömmlichen Produkten für intelligente Agenten/MCP in diesem Planungsmodus, der „anhalten und verlangsamen“ kann.
Einfach ausgedrückt: Nachdem MCP eine Aufgabe erhalten hat, zerlegt es die Aufgabe automatisch in einen bestimmten Plan, beginnt dann mit der Ausführung der Aufgabe und generiert schließlich Ergebnisse. Aber es sei unvermeidlich, dass „ein falscher Schritt zu einem falschen Schritt führen wird“.
Nachdem der Schaltflächenraum den Planungsmodus aktiviert hat, kann er die Ausführung komplexer Aufgaben „anhalten“ und sich mit Benutzern an wichtigen Knotenpunkten abstimmen, sodass Benutzer Fehler und Abweichungen in Echtzeit korrigieren und die Ausführungslogik optimieren können.
Diese Methode eignet sich besonders für unerfahrene Benutzer, die nicht in der Lage sind, das Engineering zu veranlassen. Wenn Sie zum ersten Mal eine Aufgabe einreichen, geben Sie Ihr Anliegen einfach kurz und prägnant an.
Für den „Planungsmodus“ gibt es zwei Auslösebedingungen:
- Einer davon ist, dass der Agent den aktuellen Schritt aus verschiedenen Gründen nicht abschließen kann (z. B. weil er keine relevanten Informationen findet oder die Absicht des Benutzers nicht genau verstehen kann) oder die Zuverlässigkeit des Ergebnisses nicht hoch genug ist – er stoppt von selbst. Wenn die Aufgabe angehalten wird, wird im Schaltflächenbereich eine Benachrichtigung angezeigt, die den Benutzer daran erinnert, den nächsten Schritt auszuführen.
- Zum anderen kann der Benutzer aktiv den „Pause-Button“ drücken: Während der schrittweisen Ausführung der Aufgabe durch den Agenten werden die schrittweisen Ergebnisse in ein .md-Dokument geschrieben, das zum Aufbau einer Wissensdatenbank und zur Unterstützung beim nächsten Schritt der Ausführung dient. Das Gleiche gilt für Button Space. Sollten Nutzer im Schritt-für-Schritt-Dokument Fehler oder Abweichungen feststellen, können sie die Korrektur selbst pausieren.
Dieser kollaborative Agenten-Workflow ermöglicht es dem Agenten, Abweichungen vom gesetzten Ziel aus verschiedenen Gründen zu vermeiden, wie z. B. „falsche Analyse am Anfang“ und Halluzinationen, die durch Denken und kontinuierliche Ausgabe von Token verursacht werden.
Dies kann folgendermaßen verstanden werden: Wenn das traditionelle große Modell/der große Agent „autonomes Fahren“ ist, können Benutzer über den Tastenbereich tatsächlich den „Copiloten“ (Copilot) der KI spielen. Sobald der Benutzer eine Abweichung bemerkt, kann er sofort die Bremse betätigen und das Lenkrad manuell korrigieren.
Wenn wir die Analogie eines Praktikanten verwenden, ist Button Space ein KI-Praktikant, der „jederzeit Fragen stellen kann, wenn man etwas nicht versteht“ und dann die Arbeitsrichtung basierend auf Echtzeit-Feedback flexibel anpassen kann.
Tatsächlich gibt es mehr als einen KI-Praktikanten, aber es können viele sein:
- Für Routineaufgaben wie Textverarbeitung, Diagrammerstellung, einfache Analysen usw. ist Button Space selbst ein allgemeiner Praktikant. Er kann als „kleiner Sechseckkrieger“ mit relativ umfassenden Fähigkeiten betrachtet werden, legt aber keinen Schwerpunkt auf Spezialgebiete;
- Für Aufgaben in vertieften Berufsfeldern wie Nutzerforschung, Finanzindustrieforschung usw. sind „Domänenexperten“ erforderlich.
Unabhängig davon, ob es sich um einen Allzweck- oder Expertenagenten handelt, kann er über den „Button Space“ aus einer Hand geplant werden.
Darüber hinaus können Entwickler, wenn die vorhandenen Expertenagenten nicht ausreichen, auch die Kouzi-Entwicklungsplattform (nullbasierte Entwicklung von Agenten), Kouzi Compass (Agent-DevOps-Tuning-Tool) und Eino (Go Language Agent Development Framework) nutzen, die gleichzeitig vom Kouzi-Team eingeführt wurden, um schnell ihre eigenen Expertenagenten zu entwickeln und auf den Markt zu bringen.
KI-Praktikant hat endlich ein Gehirn
Natürlich war Button Space in den meisten Tests von Aifan'er in der Lage, die Absicht genauer zu verstehen und qualitativ hochwertige Ergebnisse zu generieren.
Der Zollkrieg war in letzter Zeit sehr lebhaft, daher haben wir uns auch an diesem schwierigen Problem versucht: der Verfolgung der US-Zölle auf wichtige Importkategorien nach China.
Hinweis: Die Zollpolitik der US-Regierung hat sich in letzter Zeit von Tag zu Tag geändert. Sie müssen ein Online-Formular erstellen, das in Echtzeit aktualisiert werden kann, um die Tarifänderungen seit dem 1. April zu verfolgen. Sie müssen die Steuersätze für die wichtigsten aus China in die Vereinigten Staaten exportierten Produkte wie Unterhaltungselektronikgeräte, Spritzen, Spielzeug usw. im Auge behalten. Überprüfen Sie die spezifischen Produkte selbst. Wenn Sie es nicht herausfinden können, können Sie jederzeit anhalten und mich fragen. Beachten Sie, dass einige Tarifkategorien kürzlich neu hinzugefügt wurden, einige Tarifkategorien jedoch bereits vor 2025 existierten. Sie müssen in der Tabelle zeigen, wie sich die verschiedenen Tarifkategorien verhalten. Wenn Sie es nicht verstehen, fragen Sie mich gerne.
Werfen wir zunächst einen Blick auf die generierten Ergebnisse:
Ai Faner beobachtete den Denkprozess und stellte fest, dass er über ein umfassendes Verständnis komplexer Konzepte wie „Zölle“ verfügte, was möglicherweise mit dem dahinter stehenden großen Modell zusammenhängt.
Im letzten Monat oder so haben wir tatsächlich viele Agenten-/MCP-Tools verwendet, insbesondere einige Produkte mit umfassenden Forschungsfunktionen, die behaupten, komplexe Aufgaben im Namen der Benutzer ausführen zu können. Wenn sie sich mit der gleichen Aufgabe befassen, müssen sie Dutzende Suchrunden durchführen. Es scheint, dass sie sich sehr bemühen, zu verstehen, was der Benutzer sagt, was den Leuten das Gefühl gibt, zu viel Kraft aufzuwenden, aber die Ergebnisse sind nicht ideal.
In Button Space gab es nur sechs Denkrunden, von denen nur vier tatsächlich zum Suchen und Verstehen von Tariftypen verwendet wurden (die verbleibenden zwei Runden waren Planung und Zuordnung zu Beginn der Aufgabe und Webseitenerstellung am Ende der Aufgabe).
Die generierten Ergebnisse sind aus visueller Sicht nach wie vor sehr überzeugend.
Und es ist ersichtlich, dass dieser KI-Praktikant nicht nur zeigte, wo er zuschlagen sollte, sondern in gewissem Maße auch sein Gehirn einsetzte und einige Datenanalysen durchführte, die nicht den anfänglichen Aufgabenanforderungen entsprachen, von denen er aber dachte, dass sie hilfreich wären. Der Zeitplan für Tariferhöhungen und -senkungen in diesem Jahr ist beispielsweise aufgeführt:
Es wurde eine Analyse der kurz-, mittel- und langfristigen Auswirkungen durchgeführt:
Es gibt auch eine strukturierte Präsentationsmethode, die Diagramme und Text kombiniert:
Und was mich am meisten verblüfft: Es erfasst die Unterschiede und Überlagerungen verschiedener Tarifpositionen wie Grundtarif, „Freiheitstag“ und „Äquivalenz“ vor 25 Jahren.
Aber auch Fehler sind sehr leicht zu erkennen, etwa dass die Steuersätze in den meisten Kategorien völlig falsch berechnet werden. Was den Grund für den Fehler betrifft, so verstehe ich, dass der Praktikant eine reine Suchmethode für Nachrichten verwendet hat und leicht durch falsche und unzeitgemäße Informationen beeinflusst wurde, anstatt direkt Daten von der Website der US-Regierung abzurufen.
Natürlich würde das wahrscheinlich auch ein echter Praktikant tun. Nur Import- und Exportexperten und Zollexperten wissen, wie sie die aktuellsten und genauesten Werte erhalten. Diese Aufgabe erfordert Fachwissen und Erfahrung, die weit über das Niveau eines Praktikanten hinausgehen.
Dies bedeutet jedoch nicht, dass Button Space dieses Problem nicht lösen kann: Nachdem wir den „Planungsmodus“ aktiviert haben, können wir ihm beim Korrigieren von Fehlern eine klare Datenquellendefinition geben und ihn aktiv Python/MySQL oder andere Codierungsfunktionen aufrufen lassen, um die genauesten und realsten Daten zu crawlen. Oder wir können Berichte mit nicht optimiertem Format und Inhalt auch manuell von maßgeblichen Quellen herunterladen und dann das offiziell unterstützte Plug-in für mehrdimensionale Tabellenerweiterungen verwenden, um die für die Aufgabe erforderliche Wissensdatenbank zu generieren.
Kouzi Space unterstützt den Aufruf externer MCP-Tools (offizielle Version) und unterstützt derzeit mehr als zehn interne und externe MCP-Erweiterungen von ByteDance (wie Moji Weather, Amap usw.). Daher können professionelle Datenbankanbieter in der Import- und Exportbranche theoretisch auch eigene MCP-Erweiterungen entwickeln und in den Button-Bereich integrieren. So kompliziert und unsinnig die Tariffortschritte auch sein mögen, die Praktikanten lassen sich nicht beirren.
Sehen Sie sich die Wiederholung der Tarifaufgabe online an
Hier ist eine weitere kleine Aufgabe mit reinem Code, die möglicherweise etwas übertrieben ist. Lassen Sie den Tastenbereich einen Hallo-Welt-Drucker erstellen und ändern Sie die Anforderungen auf halbem Weg.
Führungskräfte, die nicht programmieren können, müssen sich aber keine Sorgen machen, dass ihre Mitarbeiter weglaufen: Sie können auch KI-Praktikanten bitten, Ihnen das Programmieren beizubringen.
Sehen Sie sich die Wiedergabe der Codeaufgabe online an
Die vorherigen Tests basierten alle auf dem standardmäßig in Button Space aktivierten „Universal Intern“.
Auf der Homepage gibt es auch einen Zugang zu „Expert Agent“. Derzeit sind zwei verfügbare Experten in der Beta-Phase geöffnet, nämlich der User Research Expert (offiziell entwickelt von Kouzi) und der Huatai A-Share Observation Assistant (gemeinsam entwickelt von Huatai Securities und Kouzi).
Nehmen Sie als Beispiel den A-Share Observation Assistant. Die Einstiegsoberfläche unterscheidet sich geringfügig von der eines allgemeinen Praktikanten. Es ermöglicht Benutzern, tägliche Berichte basierend auf selbst ausgewählten Aktien und Sektoren anzupassen. Es unterstützt auch Einzelberatungsfunktionen und macht den Agenten zu einem Wertpapieranalysten, den der Benutzer exklusiv nutzen kann.
Diese beiden Expertenagenten spiegeln auch direkt die MCP-Erweiterungsmöglichkeiten des Schaltflächenbereichs wider. Es kann das große Button-Modell und die großen Modellfunktionen von Drittanbietern in den gleichen Kontext bringen, um eine „Zusammenarbeit“ zwischen MCP-Servern zu erreichen.
Wenn KI vom „Werkzeug“ zum „Partner“ wird: Mensch und Maschine teilen sich nicht die Arbeit, sondern entwickeln sich symbiotisch weiter
Die Kapazitätsobergrenze herkömmlicher Produkte und Tools für große Modelle legt fest, dass ihr Hauptzweck darin besteht, Transaktionsarbeit abzuwickeln und repetitive Arbeit zu ersetzen (z. B. Textgenerierung, Datensortierung und -formatierung, grundlegende Planung usw.); und wie bereits erwähnt, integrieren Agenten/MCP die Fähigkeit zum tiefgreifenden Denken, zum Zerlegen und Planen von Aufgaben sowie zur schrittweisen automatisierten Ausführung von Aufgaben, aber dieser „vollautomatische“ Ansatz hat immer noch Nachteile.
Im Vergleich zu den ersten beiden schlägt Kouzi Space eine neue Idee vor: In einer Umgebung, in der der gesamte Prozess in Echtzeit von echten Benutzern überwacht wird, kann KI tief in den gesamten Arbeitsablauf der Problemlösung eingebunden werden und die organische Zusammenarbeit von Menschen und intelligenten Agenten realisieren.
„KI-Praktikant“ ist in der Tat eine interessante Analogie. Während der Zusammenarbeit mit Ihnen lernt es von Ihnen, macht sich nach und nach mit Ihren Arbeitsgewohnheiten und Anforderungen vertraut und beherrscht Ihre Zielmotivation und Denklogik. Jeder exzellente Mentor hofft, dass seine Praktikanten zu Vollzeitmitarbeitern heranwachsen können, die für ihre eigenen Angelegenheiten verantwortlich sind, und diese Art von Wachstum kann nur schrittweise durch intelligente Arbeitsmethoden und die Bereitstellung immer wieder erzielter Ergebnisse erreicht werden.
Ständig werden Tools eingeführt und die Art und Weise, wie wir arbeiten, wird durch KI immer cooler. Letztendlich ist es jedoch der richtige Weg, Ergebnisse effizient und stabil zu liefern.
Aus einer anderen Perspektive: Wenn gleichzeitig die Fähigkeiten und der Gehorsam von KI-Tools verbessert werden, kann jeder Arbeitsplatzmitarbeiter jederzeit seinen eigenen KI-Praktikanten rufen und immer komplexere und schwierigere Aufgaben können leicht gelöst werden. Wohin werden die Arbeiter selbst gehen?
Vielleicht ist dies sowohl ein Weckruf als auch eine Chance, die uns daran erinnert, dass wir unsere Energie und Zeit auf die folgenden zwei Aspekte konzentrieren sollten: erstens die Verbesserung unserer Fähigkeit, KI-Tools zu steuern; Zweitens: Konzentration auf kreative und denkende Arbeit, die niemals durch KI ersetzt werden kann.
Denn am Arbeitsplatz mangelt es nie an der Fähigkeit, etwas zu tun, sondern an originellem Denken.
Natürlich wird es einige Zeit dauern, diese Zukunft zu verwirklichen. Vielleicht möchten Sie sich jetzt für die Kouzi Space Experience-Qualifikation bewerben und Ihren KI-Praktikanten/Digital-Workplace-Partner zuerst ausprobieren lassen.
Vielleicht werden sich Ihre Arbeitsweise und die Qualität Ihres Arbeitslebens stark verändern.
# Willkommen beim offiziellen öffentlichen WeChat-Konto von aifaner: aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich zur Verfügung gestellt.
Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo