KI boomt seit zwei Jahren und die Technologie entwickelt sich rasant. Hat das große Modell das Kommerzialisierungsdilemma durchbrochen?
Seit dem Aufkommen von ChatGPT ist die KI-Begeisterung bereits seit zwei Jahren im Umlauf. In den letzten zwei Jahren waren normale Menschen von den Fähigkeiten großer Sprachmodelle begeistert. Sie können mit nur einer einzigen Anweisung flüssige und natürliche Texte erzeugen. Szenen aus Science-Fiction-Filmen sind jetzt Realität.
Auch die Entwicklung großer Modelle steht an einem Scheideweg, wenn es darum geht, neue Technologien in neue Produkte umzuwandeln, echte Bedürfnisse zu erfüllen und sich zu einem neuen Geschäftsökosystem zu entwickeln.
So wie mobiles Bezahlen, Smartphones und LTE gemeinsam den Wohlstand des Zeitalters des mobilen Internets entfacht haben, ist auch die KI-Branche in diesem Jahr gespannt auf die Suche nach einem solchen PMF (Product Market Fit).
Die große Reise der neuen Technologien hat begonnen. Ob ein neuer Kontinent entdeckt werden kann, wird darüber entscheiden, ob Big Model ein weiteres geldverbrennendes Kapitalspiel, eine beschleunigte Wiederholung der .com-Blase oder der Beginn einer neuen industriellen Revolution ist, wie Huang Renxun sagte . Die Antwort wird uns schneller zur Verfügung stehen als AGI.
Große Probleme mit großen Modellen
Der Wettbewerb der Basismodelle hat sich heute grundsätzlich als stabiles Muster herausgebildet. Unter der Führung von OpenAI ist ChatGPT ebenfalls Marktführer. Auch Anthropic, DeepMind, Llama und Grok haben ihre eigenen Stärken.
Das Spannendste in diesem Jahr ist daher nicht, wie viele weitere Parameter erweitert wurden oder wie viele Sekunden die Reaktionsgeschwindigkeit verbessert wurde, sondern wie die große Modelltechnik in ein brauchbares Produkt umgewandelt wurde.
Die Implementierung der Technologie großer Sprachmodelle war von Anfang an ein großes Problem. Harvard Business Review hat einmal eine Umfrage durchgeführt und herausgefunden, dass es bis zu 100 Arten generativer KI-Anwendungen gibt.
Es gibt jedoch fünf große Kategorien: technische Problemlösung, Produktion und Bearbeitung von Inhalten, Kundenbetreuung, Lernen und Bildung, künstlerisches Schaffen und Forschung.
Die bekannte Investmentgesellschaft a16z hat in ihrem Team hervorragende generative KI-Produkte vorgestellt, von denen viele bekannt sind, wie zum Beispiel die Allzweckprodukte Perplexity, Claude und ChatGPT. Es gibt auch eher vertikale Produkte, wie zum Beispiel die Notizprodukte Granola, Wispr Flow, Every Inc., Cubby usw. Außerdem gibt es NotebookLM, den diesjährigen größten Gewinner im Bildungsbereich, oder die Chatbots Character.ai, Replika usw.
Blooming Flowers ist für normale Benutzer gedacht: Die meisten der oben genannten Produkte sind kostenlos und ausreichend. Die Kosten für die Abonnementversion oder Pro-Version betragen nicht unbedingt das nötige Geld. So stark wie ChatGPT, belaufen sich die diesjährigen Abonnementeinnahmen auf etwa 283 Millionen US-Dollar pro Monat, was einer Verdreifachung im Vergleich zum Vorjahr entspricht. Doch angesichts der enormen Kosten scheinen diese Einnahmen ein Tropfen auf den heißen Stein zu sein.
Die Freude an der Entwicklung von Wissenschaft und Technologie ist für normale Benutzer eine erfreuliche Sache, während Speiseöl unter dem Feuer den Praktikern überlassen bleibt: Egal wie aufregend die technologische Entwicklung ist, sie kann nicht im Labor bleiben, sondern muss in die kommerzielle Gesellschaft gelangen, um getestet zu werden . Das Abo-Modell findet keine breite Akzeptanz und die Zeit für Werbung ist noch nicht gekommen. Es bleibt nur noch sehr wenig Zeit, um Geld für große Modelle zu verschwenden.
Im Gegensatz dazu ist die Entwicklung des toB-Geschäfts deutlich zuversichtlicher.
Die Zahl der Erwähnungen von KI in Gewinnaufrufen der Fortune-500-Unternehmen hat sich seit 2018 fast verdoppelt. Generative KI war das Top-Thema, das in 19,7 % aller Gewinnaufrufe genannt wurde.
Dies ist auch der Konsens der gesamten Branche. Laut dem von der China Academy of Information and Communications Technology veröffentlichten Blue Paper „Artificial Intelligence Development Report (2024)“ werden im Jahr 2026 mehr als 80 % der Unternehmen generative APIs für künstliche Intelligenz verwenden oder generative Anwendungen einsetzen.
Anwendungen für die Unternehmensseite und die Verbraucherseite zeigen unterschiedliche Entwicklungstrends: Auf der Verbraucherseite stehen bei großen Modellanwendungen Niederschwelligkeit und Kreativität im Vordergrund. Auf der Unternehmensseite legen große Modellanwendungen mehr Wert auf professionelle Anpassung und Nutzen-Feedback.
Mit anderen Worten: Effizienzsteigerung ist natürlich das, was jedes Unternehmen anstrebt und erreichen möchte, aber diese vier Worte sind zu vage. Große Modelle müssen beweisen, dass sie tatsächlich Probleme in Nutzungsszenarien lösen und die Effizienz wirklich verbessern können.
Finden Sie den Schnittwinkel genau und lassen Sie die Technologie fallen
Unabhängig davon, ob es um die Investition von Ressourcen oder die Intensität der Marktentwicklung geht, wird der inländische Wettbewerb um große Modelle im Jahr 2024 hart sein.
Nach Angaben des Ministeriums für Industrie und Informationstechnologie wird die Wachstumsrate des großen chinesischen Marktes für Sprachmodelle im Jahr 2023 100 % überschreiten und die Marktgröße 14,7 Milliarden Yuan erreichen. Verschiedene Hersteller versuchen aktiv, den Kommerzialisierungsprozess voranzutreiben: Die Kosten für Token-Abrechnung, API-Aufrufe usw. werden kontinuierlich gesenkt. Die Preise vieler Mainstream- und beliebter Allzweck-Großmodelle sind nicht mehr weit davon entfernt, unbrauchbar zu sein.
Es ist besser, die Preise zu senken und die Kosten zu senken. Das Geschäft zu verstehen und die Szenarien zu analysieren ist ein schwierigerer Weg.
Allerdings beteiligt sich nicht jedes Unternehmen an einem Preiskampf und setzt auf niedrige Preise, um zu gewinnen.
„In diesem Fall ist es wichtiger, unsere Eigenschaften zu finden und unsere Vorteile voll auszuschöpfen. Es gibt viele Szenarien innerhalb von Tencent selbst, die uns mehr Einblicke geben und unsere Fähigkeiten weiter verbessern.“ ToB-Produktmanager Zhao Xinyu denkt so: „Schauen Sie nach außen, konzentrieren Sie sich auf eine Branche, konzentrieren Sie sich auf einige spezifische Szenarien in dieser Branche und expandieren Sie dann langsam.“
Unter den vielen Basismodellen ist Hunyuan vielleicht nicht das beliebteste, aber seine technische Stärke kann nicht ignoriert werden.
Im September veröffentlichte Hunyuan das allgemeine Literaturmodell Hunyuan Turbo, das eine neue Hybridmodell-of-Experten-Struktur (MoE) übernimmt. Von Sprachverständnis und -generierung über logisches Denken, Absichtserkennung bis hin zu Kodierung, langen Kontext- und Aggregationsaufgaben weist es eine recht starke Leistung auf. In der dynamischen Update-Version im November wurde es zum leistungsstärksten Modell der gesamten Serie aufgewertet. Derzeit werden die Funktionen von Tencent Hunyuan vollständig über Tencent Cloud exportiert. Durch die Bereitstellung von Modellen mit mehreren Größen und Typen in Kombination mit anderen KI-Produkten und Funktionen von Tencent Cloud Intelligence können Modellanwendungen in Szenarien implementiert werden.
Betrachtet man die aktuellen Umsetzungsformen von Musteranwendungen, so lassen sich diese grob in zwei Typen einteilen: Ernstszenen und Unterhaltungsszenen. Letzteres ähnelt Chatbots, Begleitanwendungen usw.
„Schwerwiegende Szenarien“ beziehen sich auf Anwendungsszenarien, die eine höhere Genauigkeit und Zuverlässigkeit im Kerngeschäft von Unternehmen erfordern. In diesen Szenarien sind große Modelle für die strukturierte Informationsverarbeitung verantwortlich und müssen häufig voreingestellte Geschäftsprozesse und Qualitätsstandards befolgen. Ihre Anwendungseffekte stehen in direktem Zusammenhang mit der betrieblichen Effizienz und den Geschäftsergebnissen.
Tencent Cloud hat einmal einem Anbieter von Outbound-Anrufen beim Aufbau eines Kundendienstsystems geholfen . Dies ist ein typisches ernstes Szenario. Gleichzeitig beinhalten ausgehende Anrufe die Fähigkeit zum Dialog in natürlicher Sprache, zum Verständnis von Inhalten und zur Analyse, und es scheint, dass die natürliche Sprache ein hohes Maß an Anpassungsfähigkeit an große Sprachmodelle aufweist.
Tatsächlich liegt die Herausforderung im Detail. Damals stand das Team vor zwei zentralen Herausforderungen. Das erste sind Leistungsprobleme. Aufgrund der großen Menge an Modellparametern ist es zu einem wichtigen technischen Problem geworden, wie die Antwort innerhalb von 500 Millisekunden abgeschlossen und an das nachgeschaltete TTS-System übergeben werden kann.
Der zweite ist die Genauigkeit der Dialoglogik. Das Modell wird in einigen Gesprächen unlogische Antworten geben, was sich auf den gesamten Gesprächseffekt auswirkt. Um diese Herausforderungen zu meistern, verfolgte das Projektteam eine intensive Iterationsstrategie und behielt einen schnellen Iterationsrhythmus von einer Version pro Woche innerhalb eines 1-2-monatigen Entwicklungszyklus bei.
Unternehmenskunden haben Interesse an der Technologie großer Sprachmodelle gezeigt und sind bereit, innovative Versuche zu unternehmen. Es gibt jedoch immer eine kognitive Lücke bei der tiefen Integration von Technologie und Geschäft. Dies ist nicht auf das mangelnde Verständnis des Unternehmens für sein eigenes Geschäft zurückzuführen, sondern auf die Notwendigkeit eines professionellen technischen Teams, das durch ein tiefes Verständnis der Schwachstellen der Branche und Geschäftsszenarien die am besten geeigneten Szenarien findet und maßgeschneiderte KI-Implementierungslösungen für die Branche entwickelt Unternehmen und erreichen Technologie und die beste Passform für das Unternehmen.
„Der herkömmliche Ansatz erfordert möglicherweise, dass Bediener Szene für Szene (Korpora) erstellen“, sagte Xinyu. „Bei großen Modellen müssen Sie nur eine Aufforderung geben, um die Anforderungen zu erkennen.“ Hunyuan Das Team aktualisiert die Version Fast jede Woche, was die Iteration beschleunigt. Nach ein oder zwei Monaten hat die Genauigkeit 95 % erreicht.
Für diesen Outbound-Call-Service ist die generative Technologie völlig neu. Hunyuan ermöglichte ihnen direkt, die Vorteile großer Modelle zu erkennen, wodurch die Personalkosten um drei Viertel gesenkt wurden.
„Der beste Weg ist, die Auswirkungen zu zeigen“, sagte Xinyu, wenn der Kunde ein wenig, aber nicht viel Verständnis für generative Technologie hat, ist es am effektivsten, die Auswirkungen zu zeigen. Durch die Geschäftserfahrung des Kunden können wir Szenarien finden, in die eingeschnitten werden kann, direkte Tests und Verifizierungen durchführen und die Auswirkungen aufzeigen, die verbessert werden können.
Eine ähnliche Erfahrung, die sich in der Zusammenarbeit mit Xiaomi widerspiegelt, ist eine Kooperation namens „Two-Way-Rush“.
Die andere Partei hofft, große Modelle in Q&A-Interaktionen einzuführen und KI-Suchfunktionen auf der Terminalseite anzuwenden. Dies betrifft zwei von Hunyuans Stärken: erstens die Unterstützung durch das reichhaltige Content-Ökosystem von Tencent und zweitens Hunyuans Fähigkeiten bei der KI-Suche. Bei Fragen und Antworten ist die Genauigkeit sehr wichtig.
„Am Anfang gab es noch viele Schwierigkeiten“, erinnert sich Xinyu. „Aus ihrer Sicht deckt das Geschäftsformular mehrere Szenarien ab, darunter Smalltalk, Wissensfragen und andere Arten. Darunter weist das Wissensfrage- und Antwortszenario eine relativ hohe Genauigkeit auf.“ . Erfordern."
Durch frühe Tests verdeutlichte das Hunyuan-Team seine Vorteile im Suchszenario. Die beiden Parteien arbeiteten zusammen, um die Frage-und-Antwort-Interaktion im weitesten Sinne nach verschiedenen Themenebenen zu verfeinern. Durch diese Art der Unterteilung kann das Modell die spezifischen Bedürfnisse und Wirkungsanforderungen jeder Szene besser verstehen und so eine gezieltere Optimierung durchführen.
Die Trivia-Szene wurde zum Landepunkt. Im Hinblick auf die spätere Implementierung muss Hunyuan noch viele Herausforderungen bewältigen: Unnötig zu erwähnen, dass das Verzögerungsproblem schnell sein muss und zweitens die Integration von Suchinhalten.
„Im gesamten Link haben wir eine selbst erstellte Suchmaschine und ein Absichtsklassifizierungsmodell erstellt, um festzustellen, ob es sich um eine sehr zeitkritische Frage handelt. Zum Beispiel, ob es sich um ein Thema im Zusammenhang mit Nachrichten oder aktuellen Angelegenheiten handelt, und dann bestimmen.“ ob es sich um eine Frage handelt, die zum Hauptmodell oder zur KI-Suche beantwortet werden soll.
Es werden nur die am meisten benötigten Teile aufgerufen, sodass die Reaktionsgeschwindigkeit erheblich verbessert werden kann. Eine wichtige Erkenntnis ist, dass 70 % der Anfragen an die KI-Suche gerichtet werden, was bedeutet, dass ausreichend Rich Content als grundlegendste Anrufunterstützung vorhanden sein muss.
Hinter Hunyuan steht das gesamte Content-Ökosystem von Tencent. Von Nachrichten, Musik, Finanzen bis hin zu noch spezifischeren Bereichen wie der medizinischen Versorgung finden Sie im Ökosystem von Tencent eine große Menge hochwertiger Inhalte. Hierbei handelt es sich um Daten, auf die das Hybridmodell bei der Suche zugreifen und auf die es verweisen kann. Außerdem handelt es sich um einzigartige Hindernisse.
Nach mehr als zwei Monaten intensiver Iteration wurden die Anforderungen hinsichtlich Antwortqualität, Reaktion und Leistung schließlich vollständig erfüllt und es wurde in das eigentliche Geschäft von Xiaomi eingeführt.
Das ist die Essenz des toB-Geschäfts. Um Umsatz zu erzielen und Vertrauen zu gewinnen, muss es tatsächlich einen Mehrwert für das Unternehmen des Kunden schaffen.
Nur durch die Verallgemeinerung von „Volumen“ können wir zu mehr Szenarien gelangen
Die Implementierung großer Modelle in verschiedenen Branchen und Produkten fördert tatsächlich das Wachstum der Technologie selbst.
Bei einigen großen Modellprodukten gibt es eine zentrale Überlegung bei der Wahl des toC-Pfads: die Nutzung des Feedbacks von der C-Seite zur Optimierung des Modells. Große Modelle haben einen endlosen Bedarf an Tuning, und die Anzahl und Aktivität der C-End-Verbrauchergruppen bieten Nahrung für Modelliterationen. Auf diese Weise kann das iterative Schwungrad in Betrieb genommen werden.
Tatsächlich kann dies auch im toB-Geschäft erreicht werden, wobei die Anforderungen sogar noch höher sind.
Die K12-Kompositionskorrekturfunktion für Chinesisch von „Youth Get“ nutzt die multimodalen Fähigkeiten von Hunyuan. In Kombination mit der OCR-Technologie von Tencent Cloud Intelligence wird der Inhalt der Aufsätze der Schüler identifiziert und die Aufsätze von einem großen Modell gemäß den festgelegten Bewertungsstandards bewertet.
Normalerweise ist es gut, wenn der Unterschied zwischen dem großen Modell und dem echten Lehrer innerhalb von fünf Punkten liegt – aber das ist nicht einfach zu erreichen. Zu Beginn betrug der Unterschied zwischen Hunyuans Bewertung und der Bewertung des echten Lehrers nur in 80 % der Fälle weniger als fünf Punkte.
„Das Modell verfügt über bestimmte Methoden und Fähigkeiten und kann in einigen Szenarien Probleme lösen. Die Konzentration auf das Geschäft eines bestimmten Kunden stellt jedoch höhere Anforderungen an diesen Effekt .“ Xinyu sagte: „Vielleicht kann eine Genauigkeit von 90 % Geschäftsziele erreichen.“ In 80 % der Fälle gibt es einen gewissen Abstand.“
Das bedeutet, dass wir weiter „rollen“ müssen. Da der Kundenstamm von Dienstleistungsunternehmen weiter wächst, werden auch neue Anforderungen an die Technologie selbst gestellt: Erstens wird die Iterationsgeschwindigkeit erheblich verbessert – bei C-End-Benutzern kann die Iteration ein bis zwei Monate dauern. Jetzt kann jede Woche eine Version erscheinen. Dieser hochfrequente Iterationsrhythmus hat das Wachstum und den Fortschritt des Modells erheblich gefördert.
Zweitens wurde durch die kontinuierliche Bedienung verschiedener Unternehmensszenarien auch die Generalisierungsfähigkeit des Modells erheblich verbessert. Dies zeigt, dass ein umfassender Service für die Bedürfnisse diversifizierter Unternehmen nicht nur das Tempo der Modellentwicklung und -iteration beschleunigt, sondern auch die Praktikabilität und Anpassungsfähigkeit des Modells verbessert, das von ernsthaften Szenarien auf unterhaltungsorientierte Szenarien erweitert werden kann.
Die Rollenspiel-Content-Plattform „Dream Dimension“ , die gerade eine Serie-A-Finanzierung in zweistelliger Millionenhöhe erhalten hat , hat Hunyuan-role eingesetzt, ein exklusives Rollenspielmodell des Hunyuan-Modells KI-Technologie zur Bereitstellung eines interaktiven, dramatischen interaktiven Erlebnisses mit virtuellen Charakteren.
Die Hunyuan-Rolle schafft eine neue Art der Mensch-Computer-Interaktion. Durch die Erstellung reichhaltiger und vielfältiger virtueller Charakterbilder und basierend auf voreingestellten Handlungshintergründen und Charaktereinstellungen können wir natürliche und reibungslose interaktive Dialoge mit Benutzern entwickeln.
Auf technischer Ebene wurden solche Szenarien auf die Hunyuan-Rolle angewendet, die führende Vorteile bei der Verarbeitung langer und kurzer Textdialoge, der Erkennung und Reaktion von Absichten usw. gezeigt hat, für verschiedene Anwendungsszenarien geeignet ist und hervorragende Fähigkeiten zur Inhaltsanthropomorphisierung gezeigt hat —— Es ermöglicht nicht nur herzliche Dialoge und Interaktion, sondern fördert auch die Entwicklung der Handlung und schafft ein immersives Benutzererlebnis.
Diese Eigenschaften machen Hunyuan-role zu einem leistungsstarken Tool für die Produktkundenakquise und den Benutzerbetrieb, das eine wichtige Rolle bei der Verbesserung der Benutzerbindung und der Nutzungstreue spielt. Dies spiegelt auch wider, dass die von Hunyuan entwickelte Generalisierungsfähigkeit, die in ernsthaften Szenen trainiert und verbessert wurde, ein breiteres Spektrum von Szenen abdecken und sogar auf der Geräteseite angewendet werden kann.
Von ernsten Szenen bis hin zur schrittweisen Ausweitung auf Unterhaltung, Kreativität und noch mehr Szenen ist es eine Reise, auf die sich große Modellbewerbungen begeben müssen.
Wenn die Technologie ausgereifter wird und die Kosten sinken, werden große Modelle zwangsläufig auf ein breiteres Spektrum an Anwendungsszenarien ausgeweitet. Ursprünglich konzentrierte es sich auf ernsthafte Geschäftsszenarien wie Unternehmensbüros, Datenanalyse, wissenschaftliche Forschung und andere Branchen, da diese Szenarien klare Bedürfnisse und eine hohe Zahlungsbereitschaft aufweisen.
Um weiter in die Bereiche Unterhaltung, Kreativität, Content-Produktion und andere Branchen zu expandieren, müssen wir einen Ankerpunkt in unserem Denken haben: Wir konzentrieren uns stets auf die Lösung der Bedarfspunkte in bestimmten Szenarien als Kernziel und verankern den Einstiegspunkt für die Integration großer Modellfunktionen .
Neben der Zusammenarbeit mit Anwendungssoftware ist auch eine Zusammenarbeit mit Hardwareherstellern erforderlich, damit das Modell auf der Terminalseite angezeigt und verwendet werden kann, die den Verbrauchern am nächsten ist, und so ein bequemeres und unmittelbareres Serviceerlebnis bietet, das näher am täglichen Leben der Benutzer liegt .
Dabei nehmen das Bewusstsein und die Akzeptanz der generativen KI-Technologie im Markt stetig zu und auch die Nutzerbasis wächst immer weiter. Angesichts dieses sich schnell verändernden Marktumfelds ist die Fähigkeit zur Iteration von Modellen besonders wichtig geworden. Dies spiegelt sich nicht nur in der technischen Leistung wider, sondern umfasst auch mehrere Dimensionen wie das Verständnis der Benutzerbedürfnisse und die Anpassungsfähigkeit an verschiedene Szenarien. Nur solche Modelle und Teams, die schnell lernen, kontinuierlich optimieren und sich kontinuierlich an neue Bedürfnisse anpassen können, können im Wettbewerb einen Vorsprung behalten.
Da es immer mehr Szenarien abdeckt, erreicht es auch mehr Endverbraucher. Da der Markt insgesamt die generative Technologie akzeptiert, wird die Zahl potenzieller Nutzer weiter zunehmen. Nur ein Modell, das sich schnell iterieren und verbessern kann, kann sich rasch an Veränderungen anpassen und stetiger und weiter vorankommen.
# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.
Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo