Hier sind alle größten Gemini-Ankündigungen von Google I/O 2024

Sundar Pichai, CEO von Google, spricht auf der Bühne der Google I/O über Gemini.
Google

Es überrascht nicht, dass KI auf der diesjährigen Google I/O -Entwicklerkonferenz im Mittelpunkt steht. Das Unternehmen hat gerade eine weiterentwickelte Version von Gemini 1.5 Pro vorgestellt, seiner leistungsstarken generativen KI-Suite. Gemini 1.5 Pro ist ab heute für Entwickler verfügbar und ist ein multimodales Sprachmodell, das mit Text, Sprache und verschiedenen Inhaltsformaten arbeiten kann.

Die neuesten Updates für Gemini 1.5 Pro führen ein erweitertes Kontextfenster, verbesserte Datenanalysefunktionen, Integrationen mit zusätzlichen Google-Apps und erweiterte Anpassungsoptionen ein. Darüber hinaus gibt es Verbesserungen in wichtigen Anwendungsfällen wie Übersetzung, Codierung, Argumentation und mehr.

Gemini 1.5 Flash

Hauptmerkmale von Gemini 1.5 Flash.
Google

Google hat außerdem Gemini 1.5 Flash eingeführt, ein kleineres Modell, das für engere oder hochfrequente Aufgaben optimiert wurde, bei denen Geschwindigkeit und Reaktionszeit am wichtigsten sind.

Sowohl 1.5 Pro als auch 1.5 Flash unterstützen jetzt ein 1-Millionen-Token-Kontextfenster, und Google plant außerdem, dieses auf 1.5 Pro auf 2 Millionen zu erweitern. Beide Modelle stehen Benutzern in 200 Ländern jetzt als Vorschau zur Verfügung. Die allgemeine Markteinführung ist für Juni geplant.

Längeres Kontextfenster

Google I/O-Bühne mit einer Folie auf dem Bildschirm, die über Gemini spricht.
Google

Eine der herausragenden Funktionen von Gemini 1.5 Pro ist das verbesserte Kontextfenster von 1 Million Token, das angeblich das längste aller Verbraucher-Chatbots auf der Welt ist. Das bedeutet, dass die KI nun zahlreiche große Dokumente verstehen kann – bis zu 1.500 Seiten oder etwa 100 E-Mails zusammenfassen. Es wird schließlich auch in der Lage sein, eine Stunde Videoinhalt oder Codebasen mit mehr als 30.000 Zeilen zu verarbeiten.

Google kündigte außerdem an, dass man bis Ende dieses Jahres sogar ein Kontextfenster von 2 Millionen Token erreichen und damit die Fähigkeiten der KI weiter ausbauen wolle.

Zwillinge Live

Google führt Gemini Live vor.
Google

Damit sich das KI-Modell natürlicher und intuitiver anfühlt, erhält Gemini eine neue Live-Funktion, die Ihnen ein noch besseres Gesprächserlebnis ermöglicht. Sie können mit Zwillingen nicht nur sprechen und Fragen stellen, sondern sie können auch auf eine Vielzahl von Geräuschen in Ihrer Umgebung reagieren.

Beispielsweise können Sie die Live-Funktion von Gemini nutzen, um ein Vorstellungsgespräch zu unterstützen, indem Sie sich mit Ihnen vorbereiten und proben und Schlüsselkompetenzen vorschlagen, die Sie während des Vorstellungsgesprächs hervorheben sollten. Darüber hinaus ermöglichen zukünftige Funktionen Gemini, Ihre Kamera während Live-Sitzungen zu nutzen und so Diskussionen über Ihre Umgebung zu erleichtern.

Tiefere Integration mit Apps

Ein Screenshot von Google I/O, der einen KI-Teamkollegen neben dem Moderator zeigt.
Google

Gemini 1.5 Pro wird sich auch auf die Verbesserung des KI-Chatbots konzentrieren, um als vielseitiger digitaler Assistent zu fungieren, der speziell auf die Verwaltung täglicher Aufgaben spezialisiert ist. Zu diesem Zweck integriert Google Gemini in Google Kalender, Aufgaben und Notizen, was bald durch Erweiterungen eingeführt werden soll, die letztes Jahr auf der Bard-Plattform eingeführt wurden.

Dadurch können Benutzer nahtlos Aktionen wie das Zusammenfassen von E-Mails in Gmail, den Zugriff auf Google Docs oder Drive und sogar das Hochladen von Bildern für Aufgaben wie das Hinzufügen von Ereignissen zu Google Kalender oder Elementen zu einer Einkaufsliste in Google Keep durchführen. Die multimodalen Fähigkeiten und vorgeschlagenen Funktionen von Gemini, wie das Erkennen von Schulveranstaltungslisten anhand von Fotos oder das Zusammenstellen von Rezeptzutaten in Einkaufslisten, bieten einen optimierten Ansatz für die Organisation täglicher Aufgaben.

Google hat sogar eine neue AI-Teammates-Funktion für Workspace-Benutzer angekündigt, mit der Sie virtuelle Kollegen in Ihrem Unternehmen oder Ihrer Organisation einsetzen können.

Personalisierte Edelsteine

Ein Screenshot von Google I/O mit einer Folie auf dem Bildschirm über Gems.
Google

Gemini Advanced-Abonnenten werden bald die Möglichkeit haben, Gems herzustellen, eine maßgeschneiderte Version von Gemini für eine persönlichere Interaktion. Egal, ob Sie einen Begleiter beim Training, einen Kochassistenten, einen Programmierer oder einen Schreibmentor benötigen, Gems kann an Ihre Vorlieben angepasst werden.

Durch einfaches Umreißen der Aufgaben und gewünschten Antworten verfeinert Gemini Ihre Anweisungen mit einem einzigen Klick und erstellt so ein Gem, das Ihren individuellen Anforderungen gerecht wird.

Gemini berührte fast alle Ankündigungen der Keynote, darunter die Updates für Android , die Suche, Gmail , Google Lens , Google Fotos und mehr.