Dialog mit Zhang Peng, CEO von Zhipu AI: Die technologische Revolution ist bereits schnell genug, konzentrieren Sie sich nicht nur auf die Ergebnisse von „Superanwendungen“

Dialog mit Zhang Peng, CEO von Zhipu AI: Die technologische Revolution ist bereits schnell genug, konzentrieren Sie sich nicht nur auf die Ergebnisse von „Superanwendungen“ - 27f34f9cecb39151d548b89ee8a4652d

Auf der Weltkonferenz für künstliche Intelligenz 2024 am Huangpu-Fluss entfachten Unternehmer, Entwickler und Technologiebegeisterte eine noch heißere Begeisterung als die 38-Grad-Hitze in Shanghai. Meinungen über den revolutionären Charakter großer Modelle und die Inkompatibilität praktischer Anwendungen kollidierte auch.

Wie lässt sich die Rechenleistung großer Modelle in Produktivität umwandeln?

Wenn große Modelle, Chips, Cloud Computing, verkörperte Intelligenz, autonomes Fahren und andere Hersteller die neuesten Errungenschaften vereinen und eine Miniaturlandschaft der chinesischen KI-Landschaft bilden, hofft jeder, der hierher kommt, eine Basis zu finden, die zur grauen Linie von AGI führt.

Dialog mit Zhang Peng, CEO von Zhipu AI: Die technologische Revolution ist bereits schnell genug, konzentrieren Sie sich nicht nur auf die Ergebnisse von „Superanwendungen“ - 640

„Das ist das Unternehmen, das OpenAI sehr ähnelt.“ Ich war vor dem Zhipu AI-Stand und hörte, wie ein Ausstellungsbesucher es seinen Begleitern vorstellte. Dies ist wahrscheinlich die Ansicht vieler Praktizierende.

Dieses chinesische KI-Einhorn verfügt über allgemein große Modelle in verschiedenen Größen. Es hat kürzlich das Modell GLM-4-9B herausgebracht und übertrifft damit das Modell Llama 3 8b. Das multimodale Modell GLM-4V-9B erreicht die gleichen Fähigkeiten wie GPT-4V mit einer Parametermenge von 13B. Gestern hat Zhipu AI auch das CodeGeeX-Codemodell der 4. Generation CodeGeeX4-ALL-9B bei WAIC veröffentlicht.

Dialog mit Zhang Peng, CEO von Zhipu AI: Die technologische Revolution ist bereits schnell genug, konzentrieren Sie sich nicht nur auf die Ergebnisse von „Superanwendungen“ - WechatIMG105

Auch das Kommerzialisierungstempo von Zhipu AI ist den meisten seiner Konkurrenten voraus. Heute stehen mehr als 300.000 aktive Agenten in der Qingyan-App zur Verfügung. Die offene Plattform des Zhipu AI-Großmodells hat derzeit mehr als 400.000 registrierte Benutzer und das durchschnittliche tägliche Anrufvolumen erreicht 60 Milliarden Token.

Dialog mit Zhang Peng, CEO von Zhipu AI: Die technologische Revolution ist bereits schnell genug, konzentrieren Sie sich nicht nur auf die Ergebnisse von „Superanwendungen“ - agent

Zhang Peng, CEO von Zhipu AI, ist davon überzeugt, dass die KI-Begeisterung, die durch große Modelle verursacht wird, anders ist als zuvor. In der Vergangenheit hat die KI-Technologie einige praktische Probleme gelöst, aber die heutige Entwicklung großer Modelle hat wichtigere menschenähnliche Erkenntnisfähigkeiten mit sich gebracht .

Große Modelle können Generalisierungsfunktionen für ein Modell bereitstellen, um die unterschiedlichen Anforderungen einer Reihe von Szenarien und Anwendungen zu lösen und so das Problem des Kosten-Nutzen-Verhältnisses zu lösen.

Zhang Peng nahm vor Ort auch Interviews mit APPSO und anderen Medien entgegen, in denen er über Themen wie die Implementierung großer Modelle, Superanwendungen und die zukünftige Entwicklung der Technologie sprach und einige Schlüsselthemen von der Forschung großer Modelle bis zur Kommerzialisierung abdeckte.

Im Folgenden finden Sie eine Abschrift des Gesprächs. Sie können einige Profile darüber sehen, wie chinesische KI-Unternehmen große Modelle implementiert haben.

Es werden große Modelle umgesetzt, man sollte sich nicht nur auf Superanwendungen konzentrieren

F: Wie kombiniert Zhipu im Hinblick auf TPF (Technology-Problem Fit) für große Modelle Technologie mit Produkten und setzt sie dann um? In der Branche besteht hierzu noch kein Konsens.

Zhang Peng: Ich denke nie, dass die Implementierung einer neuen Technologie einen Zyklus erfordert. Dies ist ein Naturgesetz, aber dieser Zyklus kann lang oder kurz sein, und wenn eine revolutionäre Technologie wie ein großes Modell implementiert wird, Dabei wird es sicherlich größere Herausforderungen und weitere Probleme geben, die wir lösen müssen.

Aus objektiver historischer Sicht war die Umsetzung dieser technologischen Revolution schnell genug, aber gerade weil sie so schnell ist, ist das Verständnis aller dieser Angelegenheit immer noch etwas uneinheitlich und die Varianz der Verteilung ist relativ groß.

Die Technologie muss immer noch schnell iteriert und aktualisiert werden, aber was die Anwendung betrifft, können wir nicht warten, bis sie vollständig ausgereift ist, bevor wir sie implementieren .

F: Können Sie uns einige Erfahrungen bei der Implementierung großer Modelle mitteilen?

Zhang Peng: Zunächst müssen Sie ein tiefes Verständnis für die Fähigkeit haben, dieses Modell zu erkennen. Sie sollten versuchen, seine Vorteile zu begreifen und seine Nachteile nicht auszunutzen. Wenn Sie beispielsweise das Modell auffordern, sehr genaue physikalische Modelle oder mathematische Formeln zu berechnen, ist es genauso gut wie das menschliche Gehirn sollte es nicht tun.

Es ist beispielsweise nicht angebracht, ihn als Ersatz für den Taschenrechner zu verwenden, den Sie gewohnt sind . Sie müssen daher einen geeigneten Winkel finden, um seine Vorteile voll auszuschöpfen, und dürfen nicht in die entgegengesetzte Richtung gehen oder den Platz blockieren sein Entwicklungspfad, da die Modellfähigkeiten jederzeit beeinträchtigt werden können. Die Iterationen wurden abgebrochen .

F: Wie weit sind wir von den KI-Superanwendungen entfernt, über die in letzter Zeit alle diskutiert haben? Tatsächlich gibt es nur sehr wenige KI-Anwendungen mit mehr als 10 Millionen täglich aktiven Nutzern.

Zhang Peng: Die Definition einer Superanwendung ist für jeden sehr vage. Jeder hat seine eigenen Vorstellungen. Gilt ChatGPT als Superanwendung?

F: Mal sehen, mit welcher Analogie es verglichen wird.

Zhang Peng : Ja, man muss immer eine Analogie haben. ChatGPT ist bereits das schnellste Produkt in der Geschichte mit über 100 Millionen monatlichen Nutzern. Wenn dies nicht als Superanwendung bezeichnet werden kann, was kann man dann als Superanwendung bezeichnen?

Betrachten Sie diese Schlussfolgerung nicht voreilig. Wenn Sie den Prozess beobachten, werden Sie feststellen, dass er sich sehr schnell entwickelt hat. Seien Sie also geduldig. Die Entstehung von Superanwendungen ist nicht ausschließlich eine technologiegetriebene Sache, sondern berücksichtigt auch viele Faktoren wie der Markt und ob der Benutzer bereit ist .

Lassen Sie mich ein weiteres einfaches Beispiel nennen. Die Zahl der Nutzer der Google-Suchmaschine ist groß genug, bis sie sich von der weltweiten Suchmaschine Nr. 1 zu einem erfolgreichen kommerziellen Weg entwickelt hat. 6 Jahre hat es auch für die aktuelle Meta und das ursprüngliche Facebook gedauert.

Dialog mit Zhang Peng, CEO von Zhipu AI: Die technologische Revolution ist bereits schnell genug, konzentrieren Sie sich nicht nur auf die Ergebnisse von „Superanwendungen“ - Tooltester ChatGPT April Website visitors

F: Vom Aufkommen des mobilen Internets bis hin zu WeChat und TikTok hat es auch länger gedauert.

Zhang Peng : Warum können also nicht alle noch etwas warten? Vielleicht probieren Sie es doch mal aus. Genau wie damals, als wir als Kinder das Spiel Arkanoid gespielt haben, möchte man auf die Lücke zielen und sie sehr genau treffen. Dazu muss man zuerst herausfinden, wo die Lücke ist? Wo ist der Weg?

Viele Dinge müssen nacheinander erforscht werden, und dieser Prozess ist sehr wichtig. Wir sehen nicht nur die Endergebnisse, sondern, was noch wichtiger ist, wir ergreifen Maßnahmen, denen jeder im Moment mehr Aufmerksamkeit schenken sollte.

F: Einige Leute in der Branche glauben, dass innovative Anwendungen in den nächsten Jahren umgesetzt werden könnten. Er gab eine sehr klare Zeitspanne von etwa drei Jahren an.

Zhang Peng: Wie ich gerade sagte, erfordert diese Angelegenheit eine umfassende Berücksichtigung verschiedener Faktoren, und der zweite ist, ob der Markt und die Benutzer selbst bereit sind. Das dritte ist die Entdeckung der Nachfrage, und es gibt noch ein bisschen Glück. Es gibt zu viele Variablen, und es ist schwierig, so etwas mit einem einfachen neuronalen Netzwerk wie meinem Gehirn vorherzusagen.

F: In letzter Zeit gibt es eine heiß diskutierte Meinung, dass ein Basismodell ohne Anwendung wertlos sei.

Zhang Peng : Diese Angelegenheit selbst ist in zwei Ebenen unterteilt, denn wir haben so viele wissenschaftliche Forscher, die ständig erforschen, was die menschliche Intelligenz verursacht. Wir sind von großer Bedeutung.

Die zweite Ebene. Wenn das Ergebnis dieser Erkundung darin besteht, dass wir es konstruieren und produzieren und es in eine wertvollere Produktivkraft verwandeln können, wird es von größerer Bedeutung sein .

Bei dieser Angelegenheit handelt es sich nicht um eine Wahl zwischen zwei, sondern um eine Reihe von Problemen. Die Anwendung ist natürlich sehr wichtig. Wir hoffen, dass Technologie heute in mehr neue Produktivität umgewandelt werden kann, aber das bedeutet nicht, dass unser Streben nach technologischer Innovation und grundlegender Erforschung wertlos ist. Gehen Sie nicht in eines der beiden Extreme, denn es handelt sich um eine sich gegenseitig verstärkende Beziehung.

F: Es gibt auch die Ansicht, dass das Open-Source-Modell für die meisten Anwendungsszenarien nicht geeignet ist und das kommerzielle Closed-Source-Modell am effektivsten ist. Vor einiger Zeit hat Zhipu auch die Open-Source-Version von GLM-4 veröffentlicht. Was denken Sie über das Thema Open-Source- und Closed-Source-Modelle?

Zhang Peng : Wir haben immer geglaubt, dass Open Source und Closed Source unterschiedliche wesentliche Ziele und Bedeutungen haben. Closed Source wird eher aus kommerzieller Sicht betrachtet und ist ein Geschäftsweg zur Bereitstellung besserer Dienstleistungen und sichererer Produkte. Der Zweck von Open Source für große Modelle besteht hauptsächlich darin, die Ökologie zu bereichern und technologische Innovationen zu fördern.

Wenn eine Technologie einfach einem geschlossenen und monopolisierten Entwicklungspfad folgt, wird es ihr entweder an Vitalität mangeln oder sie wird zu einem Zustand, der der gesamten Ökologie nicht förderlich ist . Ebenso wie in der Biosphäre muss ein gewisses Maß an Vielfalt erhalten bleiben. Bei Open Source geht es vielmehr darum, technologische Innovation und technologische Vielfalt aufrechtzuerhalten, damit die Open-Source-Community auch in den Kern der Technologie investieren kann.

F: Sie haben bereits erwähnt, dass der Kommerzialisierungsschwerpunkt von Zhipu auf ToB liegt. Auf welche Branchen konzentrieren sich ToB-Kunden derzeit? Bei welchen konkreten Anwendungen unterstützen Sie Kunden?

Zhang Peng: Das bedeutet nur, dass unsere derzeitige Haupteinnahmequelle immer noch auf der ToB-Seite liegt, aber es bedeutet nicht, dass unser Kommerzialisierungspfad nur ToB ist.

Derzeit decken die B-Side-Kunden, die wir bedienen, mehr als zehn Branchen ab, darunter Finanzen, Bildung, Internet, Einzelhandel, Automobil, Energie, traditionelle Fertigung usw.

Derzeit unterstützen wir Industriekunden beim Einstieg, dabei nutze ich überwiegend mehrere Wege.

Erstens verfügen wir über eine eigene offene Plattform, die unseren Kunden helfen kann, schnell und zu relativ geringen Kosten auf Modellfunktionen zuzugreifen. Sie können Innovationen schnell ausprobieren und sich dann selbst aktualisieren und ihre eigenen Produkte und KI-Unterstützung verbessern.

Das zweite ist für einige große Unternehmen gedacht, die relativ hohe Datensicherheits- und Privatisierungsanforderungen haben. Wir werden Cloud-Privatisierungslösungen und lokale Privatisierungslösungen anbieten, und dann werden wir für einige Szenarien spezifisch sein, und dann wird es chinesische Lösungen geben Auf diese Weise werden wir integrierte Software- und Hardwarelösungen anbieten.

Derzeit haben mehr als 400.000 Unternehmensbenutzer, darunter einige kleine Entwicklerteams, unsere Modell-API auf unserer Plattform registriert und genutzt. Das tägliche Servicevolumen übersteigt mittlerweile 60 Milliarden Token.

Dialog mit Zhang Peng, CEO von Zhipu AI: Die technologische Revolution ist bereits schnell genug, konzentrieren Sie sich nicht nur auf die Ergebnisse von „Superanwendungen“ - c9a1b6ad07a3704899e423f3f4f60977

F: OpenAI hat kürzlich die Bereitstellung von API-Diensten für chinesische Entwickler eingestellt und Zhipu hat bald einen Umzugsdienst eingeführt. Wie ist die aktuelle Situation der Benutzer, die hierher migrieren?

Zhang Peng: Unserer Beobachtung nach gibt es einen Anstieg, aber die Reaktion des gesamten Marktes hat einen Prozess durchlaufen. Ich habe auch meine Freunde nach der Situation gefragt. Tatsächlich hat jeder einen Anstieg beobachtet.

F: Haben Sie vor, als nächstes ins Ausland zu gehen?

Zhang Peng: Wir legen bereits unsere internationalen Geschäftsfelder fest und verhandeln derzeit über einige Geschäfte.

Wo ist der nächste Schritt für große Models?

F: GPT-5 hat sich verzögert. Die Branche geht davon aus, dass sich die Iterationskurve großer Modelle verlangsamt. Geht das Skalierungsgesetz zu Ende?

Zhang Peng: Das frühe Skalierungsgesetz war sehr einfach und konzentrierte sich nur auf die Parameter des Modells. Später entdeckte jedoch jeder, dass die Größe seiner Parameter nur einer der Faktoren und Variablen war Beispielsweise haben wir über die für das Training verwendete Datenmenge und die Anzahl der Token gesprochen und später festgestellt, dass dies auch mit der Berechnungsmenge zusammenhängt, sodass sich auch die Konnotation des Skalierungsgesetzes selbst ständig ändert.

Was der Wahrheit des Skalierungsgesetzes näher kommt, ist möglicherweise die Menge der Berechnung, die Rechenleistung und Daten kombiniert, sowie die Parameterskala. Das Endergebnis kann eine umfassende Variable sein, die das Skalierungsgesetz besser darstellen kann. Aus Sicht des Berechnungsbetrags glauben wir, dass das Skalierungsgesetz immer noch wirksam ist.

Ein Nebenbeispiel, das dies beweist, ist, dass die Vereinigten Staaten jetzt den Export von KI-Technologie einschränken. Ihr Beschränkungsmaßstab ist beispielsweise nicht mehr die Rechenleistung des Chips oder die Menge der Parameter und Daten des Modells, sondern die Menge Zeichnen Sie eine Linie basierend auf 10 hoch 24. Wenn der Berechnungsbetrag dieses Modells diese Linie überschreitet, ist dies nicht zulässig, sodass Sie sehen können, dass es sich ebenfalls in die Richtung nähert, die der Wahrheit entspricht.

Aber was ist sein Wesen? Wir erforschen es noch, denn das Skalierungsgesetz selbst ist ein beobachtetes Phänomen und eine erhaltene Regel. Es ist nicht die Konnotation einer Wahrheit .

Dialog mit Zhang Peng, CEO von Zhipu AI: Die technologische Revolution ist bereits schnell genug, konzentrieren Sie sich nicht nur auf die Ergebnisse von „Superanwendungen“ - c6f22e8c 31a6 4738 97ef

F: Wird Zhipu AI in Zukunft das große Modell auf der Clientseite oder in der Cloud bevorzugen?

Zhang Peng: Wir glauben, dass der Weg des aktuellen großen Modells darin besteht, sich in Richtung allgemeiner künstlicher Intelligenz oder sogar Superintelligenz zu bewegen, die den Menschen übertrifft. Dies ist derzeit ein relativ zuverlässiger Weg, aber wir werden uns nicht auf die Cloud oder den Client beschränken Seite. Wahl .

Wir glauben, dass die Entwicklung dieser Technologie ihre eigenen Phasen hat, wenn wir beispielsweise aufgrund der Rechenleistung und aus anderen Gründen zur nächsten Stufe der allgemeinen künstlichen Intelligenz übergehen wollen Fortschritte bei der Intelligenz oder Super-Künstliche Intelligenz. Um diese stärkere Funktion bereitzustellen, kann es dennoch zentral in der Cloud erfolgen.

Dialog mit Zhang Peng, CEO von Zhipu AI: Die technologische Revolution ist bereits schnell genug, konzentrieren Sie sich nicht nur auf die Ergebnisse von „Superanwendungen“ - WechatIMG135

▲Humanoide Roboter auf WAIC.

In einigen spezifischen Szenarien, z. B. bei Mobiltelefonen, Autos und Robotern auf dem Gerät, kann es jedoch erforderlich sein, endseitige Rechenleistung und endseitige Modelle zu verwenden, um mit der Cloud zusammenzuarbeiten. Mit diesem Modell können wir in Zukunft möglicherweise eine so intelligente Intelligenz wie die aktuelle Cloud auf Mobiltelefonen erreichen, aber dazu sind viele umfassende Faktoren wie Chips, Rechenleistung und Energie erforderlich Probleme.

Jede Technologie hat Stufen. Zu diesem Zeitpunkt sieht der Plan so aus, aber ist er (geräteseitig und cloudmäßig) die ultimative Antwort? Auf keinen Fall, es wird sich in Zukunft auf jeden Fall weiterentwickeln.

F: Wo wird Ihrer Meinung nach die nächste Entwicklung großer Modelle stattfinden?

Zhang Peng: Derzeit liegen die Sprach- und Schreibfähigkeiten großer Modelle nahe am durchschnittlichen menschlichen Niveau oder übertreffen es sogar leicht. Als nächstes hoffen wir, es mit einem Wort beschreiben zu können: „Weg von der Virtualität zur Realität“, das heißt, es ist nicht mehr darauf beschränkt, ein Gehirn in einem Bottich zu sein, sondern kann in das tatsächliche Leben und die Arbeit eintreten, um tatsächliche Produktivität zu schaffen.

Dialog mit Zhang Peng, CEO von Zhipu AI: Die technologische Revolution ist bereits schnell genug, konzentrieren Sie sich nicht nur auf die Ergebnisse von „Superanwendungen“ - b

Um dieses Ziel zu erreichen, sind neben den Sprachfähigkeiten viele weitere Fähigkeiten erforderlich, wie z. B. visuelle Fähigkeiten, Hörfähigkeiten und die Fähigkeit, Hände und Füße zum Wachsen von Händen und Füßen zu nutzen. Wir hoffen, dass es zu einem multimodalen A-Zustand kommt Ein hochmodernes Modell, das menschliche Absichten verstehen, menschliche Absichten in logische Ausführungsschritte zerlegen und mithilfe von Werkzeugen eine Verbindung zur physischen Welt herstellen kann, um diese Aufgaben auszuführen.

Da wir eine stärkere Fähigkeit wünschen, in die physische Welt einzugreifen, wird die Sicherheit wichtiger, um zu verhindern, dass sie in der realen physischen Welt schädliche Auswirkungen hat. Das Gleiche gilt für die Sicherheit mehr mit Ausrichtung, wir nennen es Superintelligenz und Superausrichtung.

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo