Baidu Wenxin Yiyan gab sein Debüt! Kann ChatGPT noch nicht abgleichen, aber seien Sie nicht enttäuscht
KI ist heutzutage wirklich der letzte Schrei.
OpenAI setzt auf die Stärke von ChatGPT, um Aufmerksamkeit zu erregen, und Google folgte mit Bard. Erst gestern stahl das GPT-4-Modell wieder das Rampenlicht. Sie haben gerade über den KI-Bereich gesungen, in dem ich mein Debüt gegeben habe. Heute ist Baidu an der Reihe.
Erst heute Nachmittag kam der mit Spannung erwartete Baidu Wenxin wie geplant. Zu Beginn der Pressekonferenz gab Baidu-CEO Robin Li jedoch allen eine Chance:
In gewissem Sinne bereitet sich Baidu (Verlag Wenxin Yiyan) seit vielen Jahren darauf vor. Wir haben vor mehr als zehn Jahren begonnen, in die KI-Forschung zu investieren, und 2019 das große Sprachmodell Wenxin eingeführt. Das heutige Wenxin Yiyan ist eine Fortsetzung der Bemühungen der vergangenen vielen Jahre.
Aber man kann nicht sagen, dass wir vollständig bereit sind. Wenxin sagte, dass die Schwelle für Benchmarking mit ChatGPT oder sogar GPT-4 sehr hoch sei. Kein großer globaler Hersteller hat es bisher geschafft, und Baidu ist der erste. Mein eigener Test zeigt, dass es noch viele Unvollkommenheiten gibt.
Wie hat der verspätete Wen Xin Yiyan abgeschnitten? Wie groß ist der Abstand zu ChatGPT? Kann es die Marktnachfrage nach großen chinesischen Sprachmodellen erfüllen? Wir haben das umfassend analysiert.
Wir werden die Website auch für interne Tests freigeben https://cloud.baidu.com/survey_summit/wenxin.html?track=C816552
Was kann eine neue Generation von großen Sprachmodellen und generativen KI-Produkten leisten?
Fünf Kernpunkte:
- Kreatives Schreiben;
- Erstellung von Geschäftstexten;
- Mathematische und logische Berechnungen;
- chinesisches Verständnis;
- Multimodale Generierung.
Für diese fünf Szenarien gab Robin Li entsprechende Demonstrationen. Erwähnenswert ist, dass es sich bei diesen Vorführungen nicht um Live-Einsätze, sondern um Aufzeichnungen handelt.
Die erste ist Wen Xin Yi Yans literarisches Schaffensvermögen.Li Yanhong brachte Wen Xin Yi Yan kontinuierlich verschiedene Probleme im Zusammenhang mit dem „Drei-Körper-Problem“ vor.
Zunächst einmal ist die Antwortgeschwindigkeit von Wenxinyiyan aus dem Demonstrationsvideo sehr schnell, viel schneller als ChatGPT, und der Inhalt, der herauskommt, ist ziemlich gut. Später werden wir die gleichen Fragen an ChatGPT und Bing Chat stellen. Schauen wir uns das an drei Unterschied zwischen den
▲ Die Animation wird nicht beschleunigt
In Bezug auf die Erstellung von Werbetexten stellte Li Yanhong Wen Xin eine Frage:
Wenn Sie ein Technologiedienstleistungsunternehmen gründen wollen, das mit großen Modellen der digitalen Aufrüstung kleiner und mittlerer Unternehmen dient, welchen Firmennamen können Sie wählen?
Hier ist sein Q&A.
Ganz zu schweigen davon, dass es ziemlich anständig ist.
Es kann auch zur Erstellung von Pressemitteilungen verwendet werden.Man kann sagen, dass KI von Anfang bis Ende verwendet wird, was der Positionierung dieses Unternehmens entspricht.
In der mathematischen Logik-Deduktion-Sitzung stellte Baidu eine Frage zu Hühnern und Kaninchen im selben Käfig. Wen Xin entdeckte zuerst, dass die Frage falsch war, änderte dann die Frage und konnte sie genau beantworten.
Bevor Wenxin Yiyan veröffentlicht wurde, hatten einige Leute vermutet, dass dieses Sprachmodell besser sein würde als OpenAI, Google und Microsoft, also zeigte Baidu auch in diesem Teil seine Fähigkeiten. Wenxin Yiyan beantwortete nicht nur die Bedeutung der Redewendung „Luoyang Zhigui“. “, erklärte auch das dahinter stehende Finanzphänomen und verfasste schließlich ein tibetisches Akrostichon mit dieser Redewendung.
Li Yanhong erwähnte am Tatort auch, dass Chinesisch der Vorteil von Wen Xin Yi Yan sei und umgekehrt die Analyse des englischen Materials zu seinem Nachteil geworden sei.
Schließlich wird Wenxin Yiyans Fähigkeit zur multimodalen Generierung vorgestellt. Das Zeichnen von Bildern, das Schreiben langer Texte und das Generieren von kurzen Videoinhalten auf der Grundlage von Texten werden nacheinander abgeschlossen. Dies ist eine Fähigkeit, die ChatGPT nicht hat.
▲ Es kann auch Dialektstimme erzeugen
Li Yanhong erwähnte auch, dass Baijiahao bereits die multimodalen Generierungsfunktionen von Wenxin Yiyan nutzt, um Textinhalte in Videos umzuwandeln.
Nach dem Treffen kann die erste Gruppe von Benutzern Wenxin Yiyan zunächst über den von Baidu bereitgestellten internen Testcode erleben. Wir haben den internen Testantrag eingereicht und werden Ihnen in Zukunft so bald wie möglich Erfahrungsinhalte zur Verfügung stellen.
Davor haben wir die verschiedenen Szenen, die bei dem Treffen gezeigt wurden, in ChatGPT (Version 3.5) bzw. Bing Chat eingespeist, um zu sehen, wie sie ausgegeben werden.
Wie ist die Erfahrung von Wenxin Yiyan im Vergleich zu ChatGPT&Bing Chat?
Während der Vorführung betonte Li Yanhong immer wieder, dass Baidu in der Verarbeitung der chinesischen Sprache eine Alleinstellung habe.
Im Vergleich zu ChatGPT und Bing Chat besteht der größte Unterschied jetzt in der multimodalen Generierung, dh Poster, Sprach- und sogar Videoinhalte können durch Sprache generiert werden.
In der Präsentation der Pressekonferenz demonstrierte Li Yanhong die Verwendung von Wenxin Yiyan zur Erstellung von Veranstaltungsplakaten, Dialektstimmen und veranstaltungsbezogenen Videos basierend auf dem Inhalt von Fragen. Die Kosten für die Erstellung von Videos sind jedoch relativ hoch und es steht zu diesem Zeitpunkt noch nicht allen Benutzern offen.
Die Möglichkeit, Bilder und Videos zu generieren, brachte unsere Augen zum Leuchten.“ Robin Li sagte auch: „Multimodale generative KI ist ein klarer Entwicklungstrend.“
Zusätzlich zu dieser Funktion sind wir auch neugierig auf andere Funktionen im Vergleich zu ChatGPT und Bing Chat, daher haben wir den in der Pressekonferenz gezeigten Inhalt verwendet, um nach ChatGPT (Version 3.5) und Bing Chat zu fragen. Lassen Sie mich zunächst auf das Fazit eingehen: Wenxinyiyan schneidet im chinesischen Bereich tatsächlich besser ab als die beiden Vorgänger ChatGPT und Bing Chat.
Die erste ist die Frage nach „The Three-Body Problem". Sowohl Bing Chat als auch Wenxin Yiyan können die Frage, wer der Autor ist und woher er kommt, korrekt beantworten, während ChatGPT die Heimatstadt von Liu Cixin fälschlicherweise als Shandong bezeichnete.
Interessanterweise ist die Informationsquelle für Bing Chat Baidu Baike.
Was die Schauspieler der TV-Serie „Three-Body Problem“ betrifft, die Anfang 2023 inszeniert werden soll, ist ChatGPT, dessen Informationsbasis im Jahr 2021 feststeckt, erneut entleert und sagt, dass die TV-Serie „Three-Body Problem“ noch nicht begann mit den Dreharbeiten, während Bing Chat die Antwort in Douban fand.
In Bezug auf das Verfassen von Geschäftstexten können alle drei ihre Meinung äußern.ChatGPT fügte auch sorgfältig einen englischen Namen hinzu, was für uns praktisch ist, um in den internationalen Markt einzusteigen.
Allerdings hat Bing Chat die Bedeutung der Frage bei der ersten Anfrage falsch identifiziert und mir nicht den genauen Firmennamen gegeben, sondern eine Lösung zur Auswahl eines Firmennamens bereitgestellt.
Welcher der drei Namen besser ist, überlasse ich jedem zu beurteilen.
Ob ChatGPT oder Bing Chat, sie lassen uns bei Matheaufgaben nicht ganz beruhigt sein, aber das in Baidus Pressekonferenz erwähnte Problem von Huhn und Hase im selben Käfig störte sie nicht, und sie beantworteten es beide genau.
Im Gegensatz dazu bevorzuge ich die Interpretation von Bing Chat, die eher wie ein überzeugender Lehrer ist, und die Antwort von Wen Xinyiyan ist ein bisschen wie eine Referenzantwort nach dem Unterricht.
In Bezug auf das chinesische Verständnis spiegeln sich die Vorteile des Wenxinyiyan wieder.
Als ich fragte „Wie teuer war das Papier damals in Luoyang“, dachte ChatGPT fälschlicherweise, dass ich nach dem Preis der Tang-Dynastie frage, und sagte mir, dass das Papier in Luoyang überhaupt nicht teuer sei Die Identifizierung von Bing Chat, aber es gab keine genauen Daten .
Und der Preis von Wenxin von zwei- bis dreitausend Wen stimmt zumindest mit den Daten überein, die ich bei der Suche erhalten habe.
Ich glaube, Sie haben auch bemerkt, dass, ganz zu schweigen vom Inhalt des Schreibens, weder ChatGPT noch Bing Chat verstehen, was tibetische Akrostichon ist.Im Vergleich dazu ist die Leistung von Baidu Wenxin Yiyan in der Tat hervorragend.
Natürlich ist ein solcher Vergleich gegenüber ChatGPT und Bing Chat unfair, schließlich haben wir Wenxinyiyan nicht offiziell erlebt, und es ist nur ein Vergleich mit der Präsentation auf der Pressekonferenz. Nachdem wir die Testmöglichkeit erhalten haben, werden wir Wenxinyiyan zum ersten Mal erleben und sehen, wie wir uns zu diesem Zeitpunkt verhalten.
Li Yanhong erwähnte in der Pressekonferenz auch, dass, obwohl die chinesische Sprache offensichtliche Vorteile hat, Wenxinyiyan nicht genug für englische Sprachen und Code-Szenarien trainiert hat und seine Leistung nicht gut genug ist. Ich glaube, dass Baidu sich in Zukunft schnell verbessern wird.
Bleiben Sie mit den Füßen auf dem Boden und schauen Sie zu den Sternen hinauf
Es besteht kein Zweifel, dass die Veröffentlichung von Wenxin Yiyan ein Meilenstein für das chinesische Internet ist.
Wie Li Yanhong eingangs sagte, ist Baidu der erste große Hersteller, der ein Produkt herstellt, das mit ChatGPT verglichen werden kann, und hat einen Durchbruch bei dem generativen KI-Produkt für große Modelle in chinesischer Sprache von Grund auf erzielt.
Aber auf der anderen Seite müssen wir auch die Lücke zwischen Wenxinyiyan und ChatGPT richtig betrachten.
Was wir heute ChatGPT oder das dahinter stehende GPT-4-Sprachmodell nennen, dauerte 5 Jahre und 4 Iterationen, um den Prozess von der quantitativen Änderung zur qualitativen Änderung abzuschließen. Es ist für Wen Xinyiyan fast unmöglich, in so kurzer Zeit aufzuholen.
Nach der heutigen Pressekonferenz zu urteilen, ist Wenxinyiyan kein revolutionäres Produkt, wie erwartet, sondern eher ein Halbzeittest der KI-Technologiereserven von Baidu, der zeigt, dass Baidu auch in der Lage ist, die Forschung und Entwicklung der fortschrittlichsten Produkte für künstliche Intelligenz voranzutreiben .
Nach der Öffnung für die Öffentlichkeit kann Wenxinyiyan durch eine große Anzahl von Suchanfragen von Benutzern lernen und sich verbessern, um die Genauigkeit und Geschwindigkeit bei der Bearbeitung entsprechender Probleme zu verbessern. Auf ChatGPT haben wir gesehen, mit welcher Geschwindigkeit sich KI-Sprachmodelle entwickeln.
Wenn Sie sich auch darauf freuen, eine echte "chinesische Version von ChatGPT" zu sehen, können Sie Wen Xin genauso gut etwas Zeit und Geduld geben. Drei Tage nach dem Abschied sollten wir uns vor allem bei KI-Modellen bewundernd ansehen.
#Willkommen, auf Aifaners offizielles öffentliches WeChat-Konto zu achten: Aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so bald wie möglich präsentiert.
Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo