Diese kommende KI-Funktion könnte Google Chrome revolutionieren
Einer der neuesten Trends im Bereich der generativen KI sind KI-Agenten, und Google bereitet möglicherweise seinen eigenen Agenten als Feature eines kommenden Gemini Large Language Model (LLM) vor.
Bei der Entwicklung mit dem Namen Project Jarvis handelt es sich um einen KI-Agenten, der im Google Chrome-Browser basiert und in der Lage sein wird, häufige Aufgaben nach einer kurzen Abfrage oder einem Befehl mit größerer Unabhängigkeit als zuvor auszuführen. Die Einbeziehung von KI-Agenten in das nächste Chrome-Update könnte laut The Information die größte Überarbeitung seit der Einführung des Browsers im Jahr 2008 sein.
Wie Gemini als Einkaufsbegleiter oder Reiseplaner fungieren kann, hat Google bereits mit seinem aktuellen Modell Gemini 1.5 Pro demonstriert, das den Chatbot Gemini Advanced antreibt. In einem zukünftigen Modell wird Project Jarvis in der Lage sein, den Kreis zu schließen, indem es verschiedene Aufgaben wie den Besuch von Websites, das Ausfüllen von Formularen und das Tätigen von Zahlungen übernimmt, um die von einem Benutzer gestellte Anfrage zu beantworten.
Beispielsweise könnte ein Gemini 1.5 Pro-Modell die Abfrage „Planen Sie mir einen Urlaub im Dezember mit einem Budget von 2.000 US-Dollar“ ausführen; Project Jarvis wäre wahrscheinlich in der Lage, die Abfrage „Planen Sie mir einen Urlaub im Dezember mit einem Budget von 2.000 US-Dollar“ auszuführen. Buchen Sie die Flüge und das Hotel und senden Sie die Details an meine E-Mail“, bemerkte Tom's Guide .
Jarvis oder „Just A Rather Very Intelligent System“ ist eine Anspielung auf Tony Starks KI-Assistenten in Iron Man . Während der offizielle Name derzeit noch unbekannt ist, passt der Codename, da Google seinem Modell Funktionen hinzufügt.
Google hat seit Mai auf seiner Google I/O-Entwicklerkonferenz Einzelheiten zu KI-Agenten bekannt gegeben und darauf hingewiesen, dass die Technologie die Verarbeitung von Sprach- und Videoinhalten unterstützen und schnellere Reaktionszeiten in Gesprächen ermöglichen würde.
Wie bereits erwähnt, könnte Project Jarvis zu den Features von Googles nächstem LLM gehören, bei dem es sich Gerüchten zufolge um Gemini 2.0 handeln soll. Die generative KI wird möglicherweise Anfang Dezember angekündigt, es gibt jedoch keine Informationen darüber, in welchem Umfang sie verfügbar sein wird, so The Information.
Während Google möglicherweise die Veröffentlichung eines eigenen KI-Agenten vorbereitet, haben viele andere Marken bereits ihre eigenen Iterationen ähnlicher Funktionen vorgestellt. Die Marke Anthropic hat kürzlich ihren Computer Use Agent vorgestellt, der es dem Claude LLM ermöglicht, selbstständig als Gerätebenutzer zu fungieren und Aufgaben zu erledigen. Die Funktion befindet sich derzeit in der Betaphase. Ebenso ist das Swarm Framework von OpenAI ein System von Agenten, die zusammenarbeiten, um Aufgaben zu erledigen. Das Unternehmen gab an, dass sich diese Technologie noch in der Forschungs- und Bildungsexperimentphase befinde.