Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet?

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? -

Ich hätte nie erwartet, dass der diesjährige „618“ mit einem großen KI-Modell starten würde.

In nur wenigen Tagen haben große inländische Modelle wie Tencent, Alibaba, Baidu, iFlytek usw. ihre Preise gesenkt, sodass wir die einfache „Shopping-Festival“-Atmosphäre schon im Vorfeld spüren können.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - APPPSOkeynote.001 1

▲ Zusammenfassung der aktuellen Preissenkungen inländischer Großmodelle

Doch bevor der Spaß beginnt, wollen wir zunächst herausfinden, was diese Hersteller unter dem Preis großer Modelle verstehen.

Nachdem ein großes KI-Modellunternehmen sein eigenes großes Closed-Source-Modell trainiert hat, verkauft es normalerweise seine API (Application Programming Interface, Anwendungsprogrammierschnittstelle) an Entwickler und erhebt eine Gebühr.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 1 13

▲ PI ist wie ein Kellner in einem Hotel, Bild von hububbble.com

Basierend auf der API für große Modelle optimieren Entwickler durch Eingabe von Daten, Feinabstimmung usw. Dies ist das Monetarisierungsmodell vieler großer Modellhersteller.

Es ist nicht schwer zu erkennen, dass sich Preisänderungen bei großen Modellen möglicherweise nicht direkt auf die Verbraucher auswirken, sondern sich direkt auf die Kosten der Entwickler auswirken, die Anwendungen erstellen.

Obwohl es derzeit einige große KI-Modellunternehmen gibt, die Mitgliedschaftssysteme, zeitbasierte Systeme und andere Modelle einführen, erfolgt die Abrechnung im Allgemeinen auf Basis der Nutzung, ähnlich wie bei Mobilfunkpaketen, mit der Ausnahme, dass sich die Abrechnungseinheit von GB Datenverkehr auf Token geändert hat .

Allerdings gibt es derzeit keinen einheitlichen Standard für die Entsprechung zwischen Token, chinesischen Schriftzeichen und Buchstaben und jedes Unternehmen hat auch seine eigene Definition. Früheren Nachrichten zufolge entspricht 1 Token von Tencent ≈ 1,8 chinesischen Schriftzeichen, 1 Token von Tongyi Qianwen = 1 chinesischen Schriftzeichen und in einigen Fällen 1 Token ≈ 0,5 chinesischen Schriftzeichen.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 2 10

▲ Bilder vom Bingjian Technology Research Institute

Daher sind die Abrechnungsstandards der einzelnen Unternehmen unterschiedlich, es gilt jedoch grundsätzlich die Regel, dass die Preisgestaltung umso höher ist, je größer der Umfang des großen Modells ist. Schließlich fallen hier Schulungskosten an.

Derzeit erforschen große Hersteller noch das Geschäftsmodell des API-Aufrufs. Viele Hersteller versuchen, die API-Aufrufe großer Modelle durch verschiedene Methoden zu erhöhen, aber das Wachstum ist nicht offensichtlich.

In diesem Fall könnte die Preissenkung großer Modell-APIs einige Entwickler dazu verleiten, KI-Anwendungen ausgehend von „kostenlosen Testversionen“ auszuprobieren, was eine gewisse positive Bedeutung für die Eroberung und Aktivierung des Marktes hat. Dies ist die Prämisse und der Hintergrund dieses „Krieges“.

Bereitet euch vor, kapituliert!

Am 6. Mai übernahm Magic Square Quantitative die Führung und startete den ersten Versuch dieser Preissenkungswelle. Der Preis seines großen Modells DeepSeek-V2 fiel auf nur 1 Yuan pro Million Input-Token. Außerdem wurde der Slogan eingeführt. Melden Sie sich an und erhalten Sie den Slogan „500W“-Tokens“.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 3png

Am 11. Mai hielt auch Zhipu Big Model „mit dem Tempo Schritt“ und führte neue Vorzugsmaßnahmen ein. Das Kontingent für neu registrierte Benutzer wurde von 5 Millionen Token auf 25 Millionen Token erhöht.

Der Preis des Einstiegsprodukts GLM-3-turbo ist von 5 Yuan auf 1 Yuan pro Million Token gesunken, was einem Rückgang von 80 % entspricht.

Bei der Bekanntgabe des Preises verglich er seinen GLM-3-Turbo auch „intim“ mit Alibaba, Baidu und ChatGPT, der voller Schießpulver war.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 4png

Anschließend brachte der Eintritt von Cloud-Anbietern diese Welle des „Kriegs“ um Preissenkungen auf einen Höhepunkt.

Am 15. Mai gab ByteDouBao bekannt: „Der Preis für große Modelle wurde gesenkt!“ Tan Dai, Präsident von Volcano Engine, gab bekannt, dass der Preis für DouBaos Hauptmodell auf dem Unternehmensmarkt 0,0008/tausend Token beträgt, verglichen mit Baidu, Ali und Modellen mit den gleichen Spezifikationen auf dem Markt beträgt der Preis im Allgemeinen 0,12/tausend Token, wodurch eine Preisinvolution „von Cent zu Cent“ erreicht wird.

Er nannte auch ein Beispiel: „Ein Yuan kann 1,25 Millionen Token des Hauptmodells von Doubao kaufen“, was etwa 2 Millionen chinesischen Schriftzeichen entspricht, was der Erzeugung von drei „Romanzen der drei Königreiche“ entspricht.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 5 10

Am 21. Mai sagte der zuständige Verantwortliche von Alibaba Cloud angesichts des Preiskampfs von ByteDance in einem Gegenangriff:

„Freundliche große Modellunternehmen haben verschiedene Preissenkungsthemen vorgeschlagen. Der Zweck der Preissenkung besteht darin, dem Markt zu helfen. Welches Unternehmen in China wirklich in der Lage ist und über das Kapital zur Preissenkung verfügt, hängt davon ab, ob die Fähigkeit des Modellbasismodells führend ist, ob Es gibt Argumentationsressourcen und ob das aktuelle Modell bereits von vielen Benutzern verwendet wird und große Modelle nicht das Kerngeschäft sind.“

Gleichzeitig führte Alibaba Cloud den Slogan „Die niedrigsten Preise der Welt durchbrechen“ ein und senkte gemeinsam die Preise seiner 9 großen Modelle. Der Preis des „GPT-4-Level“-Assistentenmodells Qwen-Long sank auf 0,5 Yuan pro Million Token.

Mit anderen Worten: Für 1 Yuan können 2 Millionen Token gekauft werden, was dem Textvolumen von 5 „Xinhua-Wörterbüchern“ entspricht, aber der Preis beträgt nur etwa 1/400 von GPT-4.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 6png

Nur wenige Stunden später ergriff auch Baidu, ein weiteres Unternehmen, das immer wieder im Vergleich steht, die beiden Hauptmodelle von Wenxin Models, ERNIE Speed ​​​​und ERNIE Lite, direkt und völlig kostenlos.

Obwohl diese beiden Modelle nicht die Flaggschiffe unter den großen Modellen sind, sind sie derzeit die Modelle, die in der großen Modellreihe von Baidu Wenxin die meisten Benutzer bedienen.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 7 7

Am 22. Mai gab iFlytek außerdem bekannt, dass es am „Preissenkungswettbewerb“ teilnehmen wird. Die iFlytek Spark Lite API wird dauerhaft kostenlos geöffnet sein, und iFlytek Spark Pro/Max kostet nur 0,21 Yuan/10.000 Token „Mit iFlytek Spark 3.5, das maximal 2,1 Yuan kostet, können Sie den Inhalt von Yu Huas „Alive“ generieren.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 8 7

Am selben Tag gab Tencent Cloud bekannt, dass es sich dem Preissenkungslager für sein Hunyuan-Lite-Modell angeschlossen hat, das ab 0,008 Yuan/Tausend Token völlig kostenlos ist -pro API sind beides. Eine Preissenkung erfolgt und ist sofort wirksam.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 9png 1

Zu diesem Zeitpunkt sind fast alle großen Modellhersteller ins Spiel gekommen. Es scheint, dass große Modelle über Nacht gemeinsam eine verrückte Preissenkung eingeleitet haben.

Die technologische Innovation hinter dem „Preiskampf“

Nicht nur inländische Hersteller, sondern auch ausländische Großmodelle, die von OpenAI vertreten werden, senken ständig die Preise für Großmodelle. Obwohl sie nicht so konzentriert sind wie inländische Hersteller, ergreifen sie früher Maßnahmen als inländische Hersteller.

Der im März 2023 eingeführte GPT-3.5-Turbo wird die Kosten pro tausend Token auf 0,002 US-Dollar senken, was 90 % niedriger ist als beim vorherigen GPT-3.5-Turbo.

Der Preis der im November veröffentlichten Input-Tokens von GPT-4 Turbo beträgt nur 1/3 von GPT-4 und der Preis der Output-Tokens beträgt die Hälfte von GPT-4.

Der kürzlich veröffentlichte GPT-4o ist 2-mal schneller als der vorherige GPT-4 Turbo, aber der Preis ist halb günstiger. Er wurde seit 2023 viermal in Folge gesenkt.

Es ist nicht schwer zu erkennen, dass für OpenAI die Preissenkung zur Kernstrategie für kontinuierliche Upgrades und Marktexpansion geworden ist. Auch andere große Modelle wie Gemini vergessen nicht, Preisänderungen nach der Leistung hinzuzufügen, und große Preissenkungen sind zu einem allgemeinen Trend geworden.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 10 8

Unabhängig davon, ob es sich um ein großes inländisches Modell oder ein großes ausländisches Modell handelt, ist der Hauptgrund für die Preissenkung die rasche Reduzierung der Inferenzkosten.

Vor nicht allzu langer Zeit stellte uns DeepSeek-V2 in einem Artikel vor, dass es MLA (Multi-Head Latent Attention) in Kombination mit MoE (Mixture-of-Experts-Experten-Hybridmodell) verwendet, um eine stufenübergreifende Verbesserung der Modellleistung zu erzielen und gleichzeitig die Menge zu reduzieren der Berechnung, vorliegende Begründungen und Kostenfälle. Interessierte Freunde können klicken, um den Originaltext anzuzeigen:

https://github.com/deepseek-ai/DeepSeek-V2/blob/main/deepseek-v2-tech-report.pdf

Da die Rechenleistung zunimmt und die Algorithmen immer weiter voranschreiten, wird sich dieser Trend fortsetzen. In einem aktuellen Interview sprach Kai-Fu Lee, Vorsitzender und CEO von Sinovation Ventures, über die jüngste Hektik der Preissenkungen und glaubte: „Es wird erwartet, dass die gesamte Branche die Inferenzkosten jedes Jahr um das Zehnfache senken wird, und das muss passieren.“

Er sagte jedoch auch, dass es sich derzeit um einen nicht nachhaltigen „OFO-Stil“-Lose-Lose-Ansatz handele: „Wenn die Technologie nicht gut ist, werden wir uns ausschließlich auf Rabatte und Verluste verlassen, um Geschäfte zu machen. Wir werden einem solchen niemals folgen.“ eine Preisgestaltung. Führen Sie ein Benchmarking durch.

Das liegt an seinem Vertrauen in seine großen Modelle: „Genau wie Tesla wird es die Preise nicht senken, nur weil andere Automarken billiger sind als er.“

Wir alle wissen jedoch, dass Tesla die Preise nicht wirklich senkt und manchmal sogar zum Vorreiter bei Preissenkungen wird. Wir fragen uns, ob seine Äußerungen in Zukunft zu einem „Bumerang“ werden.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 11 7

▲ Kai-fu Lee, Vorsitzender und CEO von Innovation Works, Bild aus dem Internet

Die Welle ist zum Greifen nah

Neben Kaifu Li hat auch Wang Xiaochuan, Gründer von Baichuan Intelligence, ein anderes Verständnis dieses Preiskampfs:

„Ich denke, genau wie das Original von Didi Meituan wird dies den gesamten B-Markt dazu anregen, schneller zu florieren, und jeder wird eher bereit sein, es auszuprobieren.“

Er glaubt, dass der Preiskampf die Hersteller, die blind in die große Modellbranche eingestiegen sind, weil sie Angst davor hatten, ins Hintertreffen zu geraten, tatsächlich daran erinnern wird, ihre Positionierung zu überdenken und einige Unternehmen zu eliminieren, die „nicht klar gedacht haben“.

„Wenn die Flut steigt und zurückgeht, wird es am Ende Perlen geben. Es muss eine Blase im Inneren sein. Preiskämpfe werden die Blase wohlhabender machen. Das bedeutet nicht, dass es in der Situation keine Blase gibt. In der vorherigen Blase Viele Unternehmen hatten das Gefühl, dass sie Modelle ausbilden mussten. Es besteht kein Bedarf für so viele Modellanbieter auf dem Markt, und es besteht keine Notwendigkeit für einen Krieg mit Tausenden von Modellen oder einen Krieg mit Zehntausenden.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 12 5

▲ Wang Xiaochuan, CEO von Baichuan Intelligence

Fu Sheng, Vorsitzender und CEO von Cheetah Mobile, hält dies für einen hilflosen Schachzug, da die Homogenisierung großer Modelle es schwierig macht, die Leistungslücke zu beseitigen:

„Diese große Preissenkung kündigte im Grunde an, dass große Modell-Startups neue Geschäftsmodelle finden müssen. Kurzfristig ist die Leistung großer Modelle auf einen Engpass gestoßen. Niemand kann jemanden loswerden, und niemand kann sich einen Trumpf ausdenken.“ Die Reduzierung der Inferenzkosten und die Senkung des Verkaufspreises haben mittlerweile für jedes Unternehmen hohe Priorität.“

Es besteht kein Zweifel, dass die großen Hersteller die Preise gesenkt haben, was für viele Start-ups in der großen Modellbranche einen größeren Wettbewerbsdruck bedeutet.

Wenn eine Branche in die Phase umfassender Preissenkungen eintritt, bedeutet dies tatsächlich den Beginn eines groß angelegten Verdrängungswettbewerbs, und am Ende sind oft nur noch wenige Unternehmen übrig.

Wir sehen oft, dass in den frühen Stadien der Branchenentwicklung aufgrund der großen Versuchung von „Fenstern“ oft verschiedene gute und schlechte Unternehmen auf dem Markt miteinander konkurrieren. Nach einer oder mehreren Runden großer Preissenkungen jedoch. Die Branche wird neu strukturiert und die Effizienz ist ineffizient. Leistungsstarke Unternehmen werden vom Markt verdrängt.

Derzeit scheint sich dieser Prozess im KI-Bereich zu beschleunigen, insbesondere für Hersteller, deren große Modelle keine Vorteile auf dem Markt haben.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 13 6

Andererseits ist die Preissenkung bei großen Modellen eine gute Nachricht für Benutzer, da sie dadurch zu geringeren Kosten auf fortschrittliche KI-Technologie zugreifen und diese nutzen können und es einfacher ist, hervorragende KI-Anwendungen auf dem Markt zu produzieren.

Allerdings ist die Kommerzialisierung der gesamten Branche derzeit noch weit davon entfernt, ein Ökosystem zu bilden. Neben großen Modellunternehmen in China gibt es noch eine große Lücke im Entwicklungsteam von KI-Anwendungen.

Den neuesten von Baidu veröffentlichten Daten zufolge verarbeitet das große Modell von Wenxin 250 Milliarden Text-Tokens pro Tag und ByteDance verarbeitet 120 Milliarden Text-Tokens pro Tag. Ein großer Teil davon ist jedoch das interne Geschäft großer Unternehmen, die KI-Anwendungen und Geschäftserkundung nutzen Es ist ersichtlich, dass derzeit tatsächlich noch kein Ökosystem in der gesamten Branche entstanden ist.

Bloomberg-Analysten haben bereits zuvor darauf hingewiesen: „China steht vor einem langen Weg zur Profitabilität in der KI-Branche, und eine Umstrukturierung der Branche könnte die Rentabilität der Branche fördern, aber es scheint unwahrscheinlich, dass dies bald geschehen wird.“ Entwicklung der Branche.

IDC prognostiziert, dass Chinas Markt für große KI-Modelle im Jahr 2026 ein Volumen von 21,1 Milliarden US-Dollar erreichen wird und die künstliche Intelligenz in eine kritische Phase für die groß angelegte Implementierung eintritt.

Es wird davon ausgegangen, dass mit dem Preisverfall großer Modelle sowie der Entwicklung von Multimodalität, beschleunigter Inferenzgeschwindigkeit und geringeren Kosten die Suche, KI-PCs/Mobiltelefone und andere Produkte der Unterhaltungselektronik zu einem weiten Bereich werden für die Entwicklung von KI-Anwendungen.

Eine solche Gelegenheit erinnert viele Menschen an die Zeit, als das Internet auf dem Vormarsch war. Tatsächlich gibt es viele Gemeinsamkeiten, warum Huang Renxun sagte, dass die gegenwärtige Ära die „nächste industrielle Revolution“ sei.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 14 6

Sinkende Grenzkosten könnten die direkte Ursache für die Revolution der KI-Plattformen sein

A16Z-Partner Martin Casado vertrat einmal die Ansicht, dass es in der Geschichte zwei Fälle von Plattformverschiebungen und Branchenrevolutionen gegeben habe, die durch sinkende Grenzkosten verursacht wurden, nämlich Chips und das Internet.

Die Geburt von Chips hat die Grenzkosten der Datenverarbeitung auf nahezu Null gesenkt. Zuvor mussten Berechnungen manuell durchgeführt werden. Die Menschen mussten in einem großen Raum mit bloßen Händen Logarithmentafeln anfertigen.

Dann wurden ENIAC und andere Maschinen eingeführt, und die Rechengeschwindigkeit stieg rasch um vier Größenordnungen. Die anschließende Computerrevolution brachte eine große Anzahl neuer Industrien hervor, belebte viele Unternehmen und brachte eine Reihe neuer Unternehmen hervor.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 15 5

Im Zeitalter des Internets sanken die Grenzkosten der Verteilung dann auf 0. In der Vergangenheit fielen die Kosten pro Bit stark an, egal was man verschickte (ein Paket oder einen Brief).

Es war auch eine Verbesserung um vier Größenordnungen, die zur schnellen Entwicklung verwandter Industrien beitrug und die Internet-Revolution anführte. Als Vertreter traten in dieser Zeit Unternehmen wie Amazon, Google und Meta hervor.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 16 4

Ähnlich wie die beiden oben genannten Technologien ist auch KI eine kostengetriebene Produktivitätsrevolution. Große Modelle reduzieren die Grenzkosten der Erstellung auf 0, z. B. für die Erstellung von Bildern und das Sprachverständnis usw. Er gab auch ein solches Beispiel.

Wenn Sie eine animierte Figur im Pixar-Stil über sich selbst erstellen möchten, würde ein großes Modell etwa 0,01 Cent kosten und nur 1 Sekunde dauern, aber die Beauftragung eines Grafikdesigners für eine Stunde würde etwa 100 US-Dollar kosten, vielleicht sogar mehr.

Anstatt etwas besser zu sein, ist KI billiger und um Größenordnungen schneller.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 17 2

▲ Vergleichen Sie die Kosten und den Zeitaufwand für die Bilderzeugung zwischen künstlicher Intelligenz und Grafikdesignern

Im Jahr 1865 stellte der britische Ökonom William Stanley Jevons fest, dass technologische Verbesserungen, die die Kohlenutzung effizienter machten, stattdessen zu einem erhöhten Kohleverbrauch in einer Vielzahl von Industrien führen würden.

Er glaubt, dass höhere Effizienz entgegen der Annahme vieler Menschen zu niedrigeren Preisen führt, was wiederum die Nachfrage ankurbelt.

Mit anderen Worten: Wenn der technologische Fortschritt die Effizienz der Ressourcennutzung verbessert, Kostensenkungen jedoch zu einer erhöhten Nachfrage führen, steigt der Ressourcenverbrauch eher, als dass er abnimmt. Dies ist das berühmte „Jevons-Paradoxon“.

Chinas großer Modellpreiskampf: Große Hersteller spielen verrückt, Kaifu Lee und Wang Xiaochuan ziehen nicht nach, wer wird zuerst getötet? - 19 1

▲ William Stanley Jevons (1835.9.1–1882.8.13)

In der Vergangenheit waren Chips und das Internet solche Ressourcen. Aufgrund ihrer verbesserten Rechen- und Informationseffizienz und niedrigeren Preise stimulierte es die Nachfrage, generierte mehr Wert und Dienstleistungen und brachte neue Plattformtransfers und Branchenrevolutionen hervor, wodurch die Produktivität gesteigert wurde und das Einkommen der Menschen, was letztendlich das Erscheinungsbild der gesamten Welt und das Leben eines jeden von uns verändert.

Dies ist die Geschichte von Chips und dem Internet vor vielen Jahren, und es ist auch die Geschichte der KI, die sich heute abspielt.

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo