Der neue KI-Agent von Perplexity kann mehrstufige Aufgaben auf Ihrem Android-Gerät ausführen

Perplexity gab am Donnerstag bekannt, dass es mit der Einführung einer Agenten-KI für Android-Geräte namens Perplexity Assistant beginnt, die in der Lage sein wird, im Namen ihres Benutzers selbstständig mehrstufige Aktionen durchzuführen.

„Wir freuen uns, den Perplexity Assistant allen Android-Benutzern zugänglich zu machen“, schrieb Aravind Srinivas, CEO von Perplexity, am Donnerstag in einem Beitrag an X. „Dies markiert für Perplexity den Übergang von einer Antwortmaschine zu einem nativ integrierten Assistenten, der andere Apps aufrufen und grundlegende Aufgaben für Sie erledigen kann.“

Der Assistent wird über die mobile Perplexity-App verfügbar sein und auf dem bestehenden „Antwort-Engine“-Modell der Plattform laufen. Daher hat Assistant Zugriff auf das Internet. Damit können Benutzer Erinnerungen und zukünftige Aktionen festlegen, ähnlich wie es die neue Aufgabenfunktion von ChatGPT bietet. Beispielsweise kann der Agent Benutzer an ein bevorstehendes Ereignis erinnern, indem er automatisch einen Kalendereintrag zur richtigen Zeit und am richtigen Datum erstellt.

Benutzer können damit auch unmittelbarere Maßnahmen ergreifen, etwa eine Mitfahrgelegenheit rufen oder nach einem Lied suchen, so das Unternehmen. Die neue Funktion kann auch auf die Kamera des Benutzers zugreifen, sodass Sie ihn theoretisch bitten könnten, nach Restaurants in Ihrer unmittelbaren Umgebung zu suchen und ihn dann für Sie reservieren zu lassen.

Perplexity Assistant kann kostenlos als Teil der mobilen App verwendet werden und wird zunächst in 15 Sprachen verfügbar sein, darunter Englisch, Spanisch, Französisch, Deutsch, Japanisch, Koreanisch und Hindi. Wie gut es mit anderen Agenten-KIs auf dem Gerät wie Gemini oder ChatGPT Tasks interagieren wird, bleibt abzuwarten.

Agenten sind die heiße Neuheit in der generativen KI. Diese leichtgewichtigen Modelle werden häufig aus größeren LLMs wie ChatGPT, Claude oder Gemini „destilliert“, haben jedoch die Aufgabe, Daten zu interpretieren und autonom Maßnahmen zu ergreifen, anstatt Inhalte zu generieren. Diese Aktionen können unkompliziert sein, wie das automatische Transkribieren eines Zoom-Anrufs, oder mehrstufig – denken Sie daran, ein 8-Gänge-Menü zu planen, die notwendigen Zutaten auf Instacart einzukaufen und dann Einladungen per E-Mail an Ihre Gäste zu senden.

Der Markt ist bereits mit KI-Agenten verschiedener führender Unternehmen gesättigt. Anthropic startete das Agentenrennen im November mit der Einführung seiner Computer Use API , die es Claude ermöglicht, menschliche Maus- und Tastaturaktionen zu emulieren, um das lokale Computersystem zu steuern. Microsoft kündigte im selben Monat Copilot Actions an und begann im Januar mit der Einführung der Agenten für Business- und Enterprise-Abonnenten . Nvidia folgte diesem Beispiel auf der CES 2025, als es seine neue Nemotron-LLM-Familie vorstellte , und OpenAI stellte erst vor wenigen Stunden schließlich seinen KI-Agenten Operator als „Forschungsvorschau“ vor.