Schwer am Morgen! Das epische Update von Googles ChatGPT, das neue Modell holt GPT-4 ein und wird die Suche vollständig untergraben
Bevor der Artikel beginnt, lassen Sie mich Ihnen eine kalte Erkenntnis mitteilen: Dieses Jahr ist das 15. Jahr, in dem Google die I/O-Entwicklerkonferenz veranstaltet.
Bei den I/O-Konferenzen der vergangenen sieben Jahre hatten KI-Inhalte für Google stets höchste Priorität. Bevor ChatGPT populär wurde, hatte Google beispielsweise bereits die LaMDA-Reihe von Sprachgenerierungsmodellen auf der I/O-Konferenz demonstriert, aber es hat nicht auf die Gelegenheit des Feuers gewartet.
Heute hat der Ausbruch von ChatGPT die KI zu ihrem besten Moment gebracht, aber es macht Google auch extrem besorgt.
Nachdem Google die gesamte Konferenz verfolgt hatte, erwähnte es fast 200 Mal das Wort „KI“ und schrieb fast KI in alle Produkte, einschließlich Gmail, Suche, Pixel usw., um allen zu beweisen, dass es immer noch an der Spitze der KI steht.
Wenn diese Konferenz vor einem halben Jahr stattgefunden hätte, wäre sie extrem spannend gewesen: KI-gestütztes Büro, KI-Suche, KI-Programmierung, alles wichtige technische Anwendungen. Schade, dass Microsoft den ganzen Weg davor gegangen ist.
Die Reaktion des Publikums kann sogar als etwas kalt bezeichnet werden. Tatsächlich gab es nur zwei große Jubelrufe: Bards Dark Mode und das kostenlose Dock für das Pixel-Tablet.
Auf der heutigen I/O-Konferenz sind die von Google veröffentlichten neuen Produkte und Technologien wie ein Aufholen mit Microsoft und OpenAI – ein Aufholen mit der präventiv realisierten KI-Zukunft.
PaLM2, Googles Geheimwaffe gegen GPT-4
Das große Sprachmodell hat sich zum Spitzenprodukt im Technologiezirkel entwickelt.Jedes Unternehmen hofft, mit einem selbst entwickelten Modell aufzukommen, das GPT herausfordern kann, seine wissenschaftliche Forschungsstärke zu beweisen, und Google ist keine Ausnahme.
Google hat eine neue Generation des großen Sprachmodells PaLM2 veröffentlicht, um mit GPT-4 zu konkurrieren.
Laut Google haben sie eine große Anzahl mathematischer und wissenschaftlicher Datensätze verwendet, um PaLM 2 zu trainieren. Verglichen mit dem PaLM-Modell des letzten Jahres hat PaLM 2 seine mehrsprachigen Verarbeitungs-, Argumentations- und Codierfähigkeiten erheblich verbessert.
Laut dem offiziellen Test von Google sind einige Ergebnisse von PaLM2 (z. B. Mathematik) besser als GPT-4.
Google hat die spezifische Parameterskala von PaLM 2 nicht offengelegt, sondern nur erwähnt, dass PaLM 2 auf den neuesten JAX- und TPU v4-Computing-Einrichtungen basiert. Google hat den Algorithmus von PaLM 2 optimiert und es kleiner als PaLM gemacht, aber mit besserer Gesamtleistung und höherer Recheneffizienz.
PaLM 2-Unterstützung Mehr als 100 verschiedene Sprachen und mehr als 20 Programmiersprachen, darunter JavaScript, Python, Prolog, Verilog, Fortran usw., kann man als Sprachmeister bezeichnen.
Herkömmliches Verstehen und Generieren von Text reicht nicht aus. PaLM 2, das Multimodalität unterstützt, kann auch Audio- und Videoinhalte verstehen und generieren. Google hat ein Modell namens Med-PaLM gezeigt, das auf den medizinischen Bereich abgestimmt ist. Laut X Lichtfilmanalyse von Patientenverletzungen, Google hat in dieser Hinsicht das Niveau menschlicher Ärzte erreicht.
Das PaLM 2-Modell kann auch in 4 Versionen unterschiedlicher Größe "geteilt" und auf verschiedenen Geräten eingesetzt werden. Beispielsweise kann ein relativ kleines Gecko-Modell auf einem Smartphone ausgeführt werden, sodass das mobile Endgerät auch über ein großes Sprachmodell verfügen kann.
Es ist erwähnenswert, dass PaLM 2 derzeit für die Vorschau geöffnet ist und Googles eigener Chat-Roboter Bard das PaLM 2-Modell verwendet hat, um seine Antwortfähigkeit zu verbessern. Google Content verfügt über mehr als 70 Produktteams, die PaLM 2 zum Erstellen von Produkten verwenden. Die meisten Updates auf dieser Konferenz basieren auf dem PaLM 2-Modell. Man kann sagen, dass PaLM 2 die Kernmaschine der umfassenden KI von Google ist.
Neben PaLM 2 hat Google-CEO Sundar Pichai auch die Nachricht vom großen Modell Gemini (Gemini) der nächsten Generation leicht verdorben, das seiner Meinung nach multimodal, effizient und für zukünftige Innovationen konzipiert wurde. .
Gemini ist ein neues Modell, das gemeinsam durch den Zusammenschluss zweier Top-KI-Teams, Google Brain und DeepMind, entwickelt wurde.Der Name lässt erkennen, dass Gemini die Stärken der beiden vereinen wird und voraussichtlich zu den leistungsstärksten großen Sprachmodellen gehören wird .
Barde: Upgrade multimodal, in der Lage, Bilder zu zeichnen und zu lesen
Es sieht besser aus, ist umfassender und kann von mehr Menschen verwendet werden.
Nach weniger als 2 Monaten Updates migrierte Google Bard auf das leistungsstärkere große Sprachmodell PalM2, ein Konkurrent von ChatGPT und BingChat, das erheblich aktualisiert und leistungsstärker wurde:
- Streichen Sie die Warteliste und öffnen Sie sich für mehr als 180 Länder und Regionen;
- Bildfrage und -antwort hinzugefügt, der Dialog ist intuitiver;
- Integrieren Sie Adobe Firefly, um schnell Bilder zu generieren;
- Quellenzitate, Dunkelmodus, Code-Export-Schaltfläche, Aktualisierung weiterer Details.
Britisch und amerikanisch begrenzt, nur Englisch, Warteliste, es ist nicht einfach, Bard mit vielen Einschränkungen zu verwenden. Mit Wirkung heute gibt Bard offiziell die Streichung der Warteliste bekannt und öffnet das Erlebnis für mehr als 180 Länder und Regionen.
Bard unterstützt jetzt auch Japanisch und Koreanisch und wird die Unterstützung bald auf 40 Sprachen erweitern, einschließlich Chinesisch.
Auch in puncto Funktionen hat Bard erhebliche Upgrades erfahren, die sich in vier Worten mit „sowohl Bilder als auch Texte“ zusammenfassen lassen. Beim Stellen von Bard-Fragen ist es nicht mehr ein Roboter, der nur trocken auf Texte antworten kann, sondern uns auch reichhaltigere und intuitivere Antworten in Form von Bildern zeigen kann.
Gleichzeitig brachte Google auch die Fähigkeit von Google Lens zu Bard, sodass dieser nicht nur auf Bilder antworten, sondern auch Bilder verstehen und Inhalte anhand von Bildinformationen entwerfen kann. Du könntest ihm zum Beispiel ein Foto von einem Hund schicken und ihn basierend auf der Hunderasse Bildunterschriften schreiben lassen.
Vielleicht liegt es daran, dass die Funktion von Vincents Bild von nebenan zu beliebt ist. Google hat Bard um diese Funktion ebenfalls erweitert, kooperiert aber mit Adobe Firefly. Durch die Integration von Fireflys Bard können hochwertige Bilder in natürlicher Sprache generiert werden. Und mit der Unterstützung von Adobe müssen Sie sich keine Sorgen um das Urheberrecht und die Qualität der Bilder machen.
Adobe ist erst der Anfang, und Google wird mit Kayak, OpenTable, Rekrutierungsunternehmen, der Khan Academy und anderen Partnern zusammenarbeiten, um Bard weitere Funktionen hinzuzufügen.
Im Vergleich zu ChatGPT positioniert sich Bard stärker in Richtung BingChat. Es ist eine Suchmaschine und ein Produktivitätstool. Es wird nächste Woche eine Referenzfunktion hinzufügen und die Quelle für den generierten Code anzeigen, um die Genauigkeit zu gewährleisten. Und die Möglichkeit, Code zu exportieren und auszuführen, wurde hinzugefügt, um Entwicklern ein effizientes Arbeiten zu erleichtern. Ganz nebenbei wurde noch ein Dark Mode hinzugefügt, der für Jubel in der Szene sorgte.
Obwohl es bei seinem Debüt einige Oolongs gab, zeigte uns Google dennoch einen sich ständig verbessernden Barden. Schade, dass wir in der Einführung am meisten von „wir werden“ gehört haben, denn nachdem alle heute veröffentlichten Funktionen implementiert und gestartet sind, wird Bard ein ausreichend umfassendes und ausgereiftes Tool sein.
Duet AI: Erledige Büroaufgaben für AI
Hier kommt der Copilot-Konkurrent.
Google hat ein neues Tool, Duet AI, für seinen Workspace eingeführt, mit dem wir sehen können, welche Rolle KI in der Cloud-basierten Google Office Suite spielt:
- Dokumentation: Vollständigen Text zusammenfassen und automatisch schreiben;
- Diashow: Vincent-Diagramm, Verbesserung der Effizienz;
- Tabellen: Daten analysieren, Strategien entwickeln.
In Google Docs können Sie Duet AI mitteilen, was Sie erstellen möchten, und Artikel automatisch generieren lassen. Sie können es auch verschiedene Schreibstile nach Ihren Bedürfnissen generieren lassen.
Die "ChatPDF"-Funktion zum "Lesen" von Artikeln und Schlüsselfragen wurde nicht zurückgelassen.
Diese Textgenerierungs-, Erweiterungs- und Anpassungsfunktionen werden auch in Google Mail verwendet.
In Bezug auf Diashows fungiert Duet AI als Bildgenerator, der Ihnen helfen kann, Zeit bei der Suche nach Bildern im Internet zu sparen und Diashows mit Originalinhalten anzureichern.
Im Formular kann Duet AI die Daten automatisch gemäß Ihren Fragen organisieren, um die Daten standardisierter zu machen.
Diese Funktionen können auch mit anderen Google-Diensten verknüpft werden: Nachdem Sie beispielsweise ein Formular in Bard erstellt haben, können Sie mit einem Klick ein Formulardokument zur späteren Verwendung generieren.
Duet AI hat auch eine Reihe von auf maschinellem Lernen basierenden Google-Cloud-Entwicklungstools hinzugefügt, die Echtzeit-Codefehlerkorrektur, -generierung usw. bieten und mehrere Entwicklungssprachen wie Go, Java, Javascript, Python usw. unterstützen können SQL.
Wir müssen nicht warten, bis Bard bestanden hat, jetzt können wir auf Duet AI warten. Wenn Sie diese Funktionen erleben möchten, müssen Sie sich trotzdem auf die Warteliste setzen und warten, bis Google den Test in der entsprechenden Region öffnet.
Insgesamt ist Duet AI weniger erstaunlich als Copilot zum ersten Mal zu sehen, und die Funktionsdemonstration scheint schwächer zu sein. Aber es dauerte weniger als zwei Monate, bis Bard aufholte. Freuen Sie sich auf weitere Möglichkeiten, die Duet AI bietet.
Google-Suche: Alles neu definiert
Zukünftige Suchen könnten so aussehen:
Angetrieben von PaLM 2 hat auch die Google-Suche eine Neuerung eingeläutet und eine neue Suchmaschine SGE (Search Generative Experience) gestartet: Sie müssen nicht mehr eine große Frage in viele kleine Fragen aufteilen und die Antworten danach zusammenstellen Suchen , mit dem Segen der generativen KI können Sie die Suche einige schwere Arbeit erledigen lassen.
Auf der Konferenz hob Google die Verbesserung der generativen KI beim Einkaufen hervor.Wenn Sie Google verwenden, um nach einem Produkt zu suchen, sehen Sie dessen Produktbeschreibung, Bewertungen, Preise und Anzeigebilder.
Google, das über mehr als 35 Milliarden Produkteinträge verfügt, aktualisiert sich ständig mit einer Geschwindigkeit von 1,8 Milliarden pro Stunde. Durch Suchen und Einkaufen auf Google erhalten Sie aktuellere und zuverlässigere Ergebnisse.
Google ist der Ansicht, dass Werbung ein wichtiger Bestandteil des Internets ist, und wird weiterhin an seinem Engagement für Werbetransparenz festhalten und sicherstellen, dass Anzeigen und Suchergebnisse unterschieden werden.
Google eröffnet heute Anmeldungen für Search Labs und öffnet den Zugang in den kommenden Wochen, wobei die Google-App und der Chrome-Browser unterstützt werden. Der Anwendungslink lautet wie folgt: labs.google.com/search
Googles KI-Angst kann nur mit KI gelöst werden
Einige Leute sagen scherzhaft, dass die diesjährige Google I/O Google AI/O heißen sollte. Die Juwelen von Microsoft und OpenAI sind vorne, und Google hat einen etwas weniger erstaunlichen Moment, aber dies ist zweifellos die entschlossenste Selbstrevolution von Google in den letzten Jahren.
Google, das behauptet, AI-first zu sein, hat aufgrund seiner übermäßig vorsichtigen und konservativen Strategie viele Male Gelegenheiten verpasst. Jetzt hat Google endlich erkannt, dass es schnell handeln muss, wie viele Google-Führungskräfte sagten, um "mutig und verantwortungsvoll" zu sein, und darf nicht länger aus Angst vor Fehlern zögern.
Natürlich ist KI kein Allheilmittel, und der aktualisierte Barde kann möglicherweise nicht den Trend der Google-Suche ändern, der untergraben wird. Aber es besteht kein Zweifel, dass KI die Suche neu gestalten und diese Interaktion revolutionieren wird.
Bing, dessen Anteil dem von Google weit unterlegen ist, hat in nur wenigen Monaten mehr als 100 Millionen täglich aktive Nutzer durch Chatbots erreicht und mehr als 500 Millionen Chats geführt, wovon 70 % der Nutzer die neue Bing-Chatfunktion ausprobieren wird es für suchbezogene Aufgaben verwenden.
Wenn die größte Suchmaschine der Welt beschließt, die Last der Vergangenheit aufzugeben und sich diesem Trend voll und ganz anzuschließen, wird sich möglicherweise nicht nur die Zukunft von Google ändern, sondern auch die Funktionsweise des Internets untergraben und die Interaktion von Milliarden von Nutzern verändert werden .
Eine neue, einfachere Welt kommt.
#Willkommen, auf Aifaners offizielles öffentliches WeChat-Konto zu achten: Aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so bald wie möglich präsentiert.
Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo