Es wurde bekannt, dass OpenAI diese Woche eine wichtige Agentenfunktion veröffentlicht hat, und Byte kündigte die Einführung des AGI-Plans an. Dies könnte das aufregendste Jahr für KI sein.
Die ChatGPT-Version von „Jarvis“ kommt wirklich.
Im Dezember letzten Jahres kündigte OpenAI-CEO Sam Altman eine interessante Umfrage an, auf die sich die Internetnutzer im Jahr 2025 am meisten freuen. AGI führt die Liste an, gefolgt von intelligenten Agenten. Nun scheint sich diese Erwartung teilweise zu erfüllen.
Laut den ausländischen Medien „The Information“ unter Berufung auf mit der Angelegenheit vertraute Personen bereitet OpenAI nun die Einführung einer neuen ChatGPT-Funktion namens „Operator“ in dieser Woche vor, mit der komplexe Aufgaben wie Restaurantreservierungen oder Reiseplanung automatisch in einem Webbrowser erledigt werden können.
Das funktionale Design von Operator ist sehr benutzerfreundlich. Insbesondere bietet es Benutzern eine Vielzahl von Aufgabenkategorien wie Essen und Aktivitäten, Lieferung, Einkaufen und Reisen, wobei jede Kategorie mit entsprechenden Vorschlägen ausgestattet ist.
Wenn der Benutzer eine Anforderung eingibt, wird auf der Chat-Oberfläche ein kleines Browserfenster angezeigt, in dem der Betriebsprozess des Operator-Agenten in Echtzeit angezeigt wird. Bei der Ausführung einer Aufgabe werden bei Bedarf Details abgefragt, beispielsweise die genaue Uhrzeit und die Anzahl der Personen, die eine Restaurantreservierung vornehmen.
Erwähnenswert ist, dass Benutzer diese Schnittstelle nicht nur manuell steuern, sondern auch Aufgaben speichern und mit anderen teilen können. Obwohl Operator derzeit keine Gmail-Vorgänge unterstützt, können sich Benutzer bei anderen Websites anmelden und der Anmeldestatus wird über mehrere Sitzungen hinweg beibehalten.
Es wurde jedoch bereits zuvor berichtet, dass der Screenshot-Inhalt, den der Betreiber bei der Ausführung von Aufgaben verwendet, möglicherweise in böswilliger Absicht verwendet wird, was zu „Prompt-Injection-Angriffen“ führt und ein ernstes Sicherheitsrisiko darstellt.
Selbst wenn es diese Woche offiziell angekündigt wird, kann es sein, dass es nicht sofort auf den Markt kommt. OpenAI hat noch nicht auf eine Anfrage nach einem Kommentar geantwortet.
Tatsächlich wird diese Art von KI-Funktion, die Benutzergeräte steuern und bei der Durchführung komplexer Vorgänge helfen kann, zum nächsten heißen Thema, das in- und ausländische KI-Unternehmen verfolgt.
Im vergangenen Oktober veröffentlichte Anthropic eine Funktion zur Computerbedienung namens „Computer Use“.
Mit dieser Funktion können Entwickler Claude durch eine API führen, um den Computer wie ein Mensch zu bedienen, einschließlich Blick auf den Bildschirm, Bewegen des Cursors, Klicken auf Schaltflächen und Texteingabe. Es stellt einen wichtigen Schritt in der Fähigkeit der KI dar, die Interaktion zwischen Mensch und Computer zu simulieren.
Nur zwei Monate später startete Google außerdem ein von Google DeepMind entwickeltes und auf dem Gemini 2.0-Modell basierendes Projekt namens Project Mariner, das Aufgaben für Nutzer im Google Chrome-Browser ausführen kann.
Zhipu verlagerte seinen Horizont nach China und veröffentlichte auch eine Webversion seiner autonomen Fahrfunktion namens AutoGLM-Web.
Über das Zhipu Qingyan-Plug-in können Benutzer die KI automatisch auf mehreren Plattformen wie Baidu, Weibo, Zhihu, Github usw. abrufen, Inhalte generieren und interagieren lassen und sogar standortübergreifende Vorgänge unterstützen, wodurch Benutzer eine „vollautomatische“ Online-Erlebnis.
In der fünfstufigen AGI-Roadmap von OpenAI befindet sich der Agent auf der L3-Ebene, die dadurch gekennzeichnet ist, dass er nicht nur denkt, sondern auch im Namen des Benutzers Maßnahmen ergreift und komplexe Aufgaben ausführt.
Brancheninsider glauben, dass intelligente Agenten die einzige Möglichkeit sind, allgemeine künstliche Intelligenz (AGI) zu erreichen, indem wir intelligente Agenten entwickeln, die Entscheidungen treffen und Aufgaben autonom ausführen können, können wir schrittweise eine allgemeine Intelligenz erreichen, die dem menschlichen Niveau näher kommt.
In diesem Wettlauf um AGI beschleunigen auch chinesische Technologieunternehmen ihr Layout.
Am 23. Januar erfuhr APPSO, dass das große Modellteam von Byte Beanbao ein internes AGI-Langzeitforschungsteam mit dem Codenamen „Seed Edge“ gegründet hat, um Projektmitglieder zu ermutigen, längerfristige, unsichere und mutige AGI-Forschungsthemen zu erkunden.
Ein Byte-naher Insider gab bekannt, dass das Ziel von Seed Edge darin besteht, neue AGI-Methoden zu erforschen. Seed ist der Name des großen Beanbao-Modellteams, während Edge die modernste AGI-Erforschung darstellt.
Derzeit hat Seed Edge zunächst fünf Hauptforschungsrichtungen identifiziert, darunter:
- Entdecken Sie die Grenzen der Denkfähigkeit
- Entdecken Sie die Grenzen der Wahrnehmung
- Entdecken Sie das Modelldesign der nächsten Generation, das Hardware und Software integriert
- Entdecken Sie KI-Lernparadigmen der nächsten Generation
- Entdecken Sie die nächste Skalierungsrichtung
Darüber hinaus legt Byte-Gründer Zhang Yiming laut später von Byte erhaltenen Informationen großen Wert auf zunehmende Investitionen in die KI-Forschung. Er studiert nicht nur persönlich Arbeiten und achtet auf technische Details, sondern kommuniziert auch eng mit führenden KI-Forschern ermutigt das KI-Forschungsteam von Byte, grundlegende Themen zu erkunden und zu erforschen.
In Singapur stellte er sogar ein engagiertes Forschungsteam zusammen, darunter Feng Jiashi, ein ehemaliger Professor an der National University of Singapore und aktueller Byte-Forscher, der seit 2023 als sein technischer Berater fungiert.
Unter den Technologiegiganten Chinas dürfte Byte derjenige sein, der über die meisten Ressourcen verfügt, am schnellsten agiert und das Potenzial hat, All-in-AI zu werden. In diesem Rennen um AGI ist der Gewinner vielleicht noch nicht bekannt, aber der Wandel hat still und leise begonnen.
# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.
Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo