Die Kontroverse um Li Jiaqi ist noch nicht abgeklungen und KI-Moderatoren, die 24 Stunden am Tag im Einsatz sind, haben den Live-Übertragungsraum gefegt
Willkommen bei den neuen Mitgliedern des Live-Übertragungsraums. Wenn Sie Fragen haben, können Sie diese auf dem öffentlichen Bildschirm posten …
Die Moderatorin vor ihr sprach mit einem Lächeln im Gesicht und stellte die Verkaufsargumente des Produkts vor, als würde sie einen Text aufsagen. Ihre Sprechgeschwindigkeit und Stimmung waren so stabil wie ihr Make-up. Sie brauchte weder Wasser zu trinken noch sich auszuruhen , und sie hatte keine schrecklichen Kopfschmerzen wie Li Jiaqi.
Nachdem Sie noch ein paar Minuten zugesehen haben, werden Sie feststellen, dass sich ihr Hals kaum bewegt und dass sie nur wenige Gesten und Ausdrücke hat. Gelegentlich stimmt auch ihre Mundform nicht überein, was die Identität der KI völlig preisgibt.
Weitere ähnliche KI-Moderatoren erobern den Live-Übertragungsraum. Vielleicht haben Sie sie schon spät in der Nacht getroffen. Können sie, die 24 Stunden am Tag arbeiten, die „Rückwelle“ werden, um Li Jiaqi und Dong Yuhui zu ersetzen?
Drei bis fünf Minuten Zuführen und Stapelkopieren ermüden die Arbeiter nicht.
„Sind diese Schuhe für Senioren geeignet?“
„Sag mir, um welches Paar es sich handelt.“
„125 (Nummer verlinkt).“
„Oh, es sind die 98 Yuan, die ich gesagt habe. Es kann getragen werden.“
Als der KI-Anker in Echtzeit meine Fragen beantwortete und mit mir hin und her plauderte, war ich innerlich geschockt.
Die Mundform, die Stimme, das Bild und das Outfit dieses Moderators und sogar der Rhythmus der Warenlieferung sind alle sehr menschlich. Der Inhalt seiner Rede passt zu seinen Gesten. Er erklärt die Details, während er das Produkt in der Hand hält, jeder Bissen voller „Schätze“. „Und von Zeit zu Zeit wiederholt er: „Klicken Sie hier, um die Ware zurückzusenden, alles inklusive.“ , Mandarin ist noch nicht dieser Standard und es gibt einen Bogen der Menschlichkeit zwischen ihm und Erjia.
Gleichzeitig klebten ihre Beine wie Meeresnadeln fest am Boden. Wenn sie nicht sprach, war es wie im Energiesparmodus. Sie nickte leicht mit dem Kopf und zeigte ein verwirrtes Lächeln. Die Theorie des unheimlichen Tals strömte mir in den Sinn bewusst.
Als der Countdown für das neue Produkt lief, zeigte der Moderator endlich sein wahres Gesicht als KI und ein offensichtlicher Fehler trat auf. Der Hintergrund der Live-Übertragung änderte sich nicht, aber die Person wechselte sofort, als ob die Sendung neu gestartet worden wäre, und blieb stehen ein paar Sekunden und fing wieder an zu reden.
Ihr Entwickler ist Silicon Intelligence, ein 2017 gegründetes KI-Unternehmen mit Sitz in Tencent.
Digitale Menschen sind nichts Neues. Silicon Intelligence begann im Jahr 2020 mit der Einführung digitaler menschlicher Produkte. Damals war ein 30-minütiges Schulungsvideo erforderlich, um einen menschenähnlichen digitalen Menschen zu generieren.
Darüber hinaus gab es vor einigen Jahren KI-Moderatoren, die Nachrichten sendeten, wie zum Beispiel N Xiaohei N Xiaobai, das von Xiaobing entwickelt wurde; das virtuelle Idol Ling Ling im chinesischen Stil, das Waren in Xiaohongshu verkauft; Huang Renxuns digitales Double erschien auf der NVIDIA-Pressekonferenz14. In Sekundenschnelle , er hat die ganze Welt getäuscht.
Im Zeitalter großer Modelle hat die digitale Menschheit einen weiteren Aufschwung erfahren. Start-ups wetten auf die richtige Gelegenheit, und auch große Hersteller beeilen sich, ins Spiel zu kommen. JD Yanxi, Tencent Smart Movie, Baidu Smart Cloud Xiling Platform, Huawei Cloud Pangu Digital People's Congress Model … Ich fürchte, ich kann es Zähle sie nicht mit zwei Händen.
▲ Bild von: Tencent Zhiying
Was die Menschen noch neugieriger macht, ist die Frage, ob sich die Technologie verbessert hat und es für normale Menschen einfacher geworden ist, KI-Anker herzustellen?
Ai Faner hat als Käufer ein Unternehmen für digitale Menschen konsultiert. Der Kundendienst teilte mir mit, dass der digitale Mensch an das Bild einer realen Person angepasst werden kann. Die Basisversion kostet 8.000 Yuan pro Jahr mit einer Auflösung von 1080p und die erweiterte Version kostet 30.000 Yuan pro Jahr bei einer Auflösung von 4K. Die Schulungsmaterialien sind hauptsächlich in zwei Arten unterteilt:
- Ein Video von etwa 3 bis 5 Minuten Länge, gesprochen von einer echten Person, ohne Worte oder ohne Zähne in den ersten 10 Sekunden. Am besten verwenden Sie Greenscreen-Videos, um das Ändern des Hintergrunds zu erleichtern.
- Eine Aufnahmedatei von etwa 30 Sekunden, die sich von der Videokopie unterscheidet, wird verwendet, um ein Vorschauvideo zu erstellen und den Lip-Sync-Matching-Effekt zu testen;
Nachdem die Schulungsmaterialien überprüft und genehmigt wurden, dauert die Schulung 2 Arbeitstage. Die Plattform gibt Feedback zum Schulungseffekt. Wenn der Käufer zufrieden ist, können die digitalen Menschen einpacken und sich auf die Arbeit vorbereiten.
Es ist jedoch zu beachten, dass die Kleidung, Bewegungen, Ausdrücke, Töne und Schönheitseffekte der angepassten digitalen Personen mit dem Videomaterial übereinstimmen und nicht ersetzt werden können. Daher versuchen die realen Personen, in ihrem besten Zustand zu bleiben, wenn sie vor der Kamera erscheinen. Nachdem die Lippenform jedoch von der KI trainiert wurde, passt sie sich automatisch an unterschiedliche Inhalte an.
Mit anderen Worten, diese Art von digitaler Person, die das Bild einer realen Person eins zu eins klont, ähnelt eher einem lippensynchronen Mundersatz oder der Trompete eines Papageis.
Wenn Sie keine digitale Person sein möchten, die auf einer realen Person basiert, können Sie kostenlos oder für 1.999 Yuan pro Jahr ein öffentliches Modell auf der Plattform wählen.
Nach der Festlegung des Ankerbildes gibt es einen weiteren Preis für die Live-Übertragung: 5.500 Yuan für 30 Tage oder 19.800 Yuan für ein Vierteljahr.
Der digitale Mensch kann nicht nur ein emotionsloser Mundpropaganda-Sender sein, er muss mit dem Publikum interagieren und jeden dazu bringen, auf den Link zu klicken.
Dies ist nicht schwer umzusetzen. Das Live-Übertragungsteam kann im Voraus eine gemeinsame Qualitätssicherung einrichten, Fragen automatisch durch die Erfassung von Schlüsselwortmustern beantworten und digitale Menschen zu Beginn der Übertragung auf drei Arten fördern.
▲ Textvokabular importieren.
- Textgesteuert, der Ausgabeton ist AI-Ton und der Text der Live-Übertragung muss im Voraus bearbeitet werden;
- Audiotreiber, der ausgegebene Ton ist die Stimme einer echten Person und die Tondatei muss im Voraus aufgezeichnet werden;
- Angetrieben von echten Menschen sprechen echte Menschen von hinten, um die digitale Bevölkerung voranzutreiben und in Echtzeit zu interagieren;
Dabei sind überall Spuren von KI zu finden. Der digitale Mensch basiert auf einem großen Modell und lernt eine große Menge menschlicher Daten; geben Sie den Produktnamen und den Preis ein, und das Live-Übertragungsskript kann mit ChatGPT generiert werden; Text-to-Speech ist auch ein Werkzeug zur Verarbeitung natürlicher Sprache.
Der KI-Anker, der mit mir interagierte, reagierte natürlicher und flexibler und wurde eher von einer realen Person gesteuert. Als sie meinen Online-Namen „Ich bin Baozi“ laut vorlas, träumte ich zurück in die Mitte Schulklasse, wo ich den Kopf senkte und vom Lehrer gerufen wurde. Am Ende habe ich natürlich nichts gekauft.
Billig bedeutet nicht gleichbedeutend mit Kosteneffizienz, es ist besser, ein Mittelsmann zu sein
Wenn man die Vorteile von KI-Ankern zählt, muss der erste sein, dass sie günstig sind.
Tao Yadong, CEO von Qianyu Intelligence, gab einmal bekannt, dass die Kosten für einen traditionellen Live-Übertragungsraum Arbeitskräfte, Ausrüstung, Veranstaltungsorte usw. umfassen, wobei die monatlichen Ausgaben 150.000 bis 250.000 Yuan betragen.
Im Gegensatz dazu geben KI-Digitalleute nur ein paar Tausend pro Monat aus, und das Live-Übertragungsteam wurde von einem Dutzend Personen, darunter Moderatoren, Assistenten, Feldcontroller und Videos, auf ein oder zwei Personen reduziert, die das Wesentliche, die Zusammensetzung, den Veranstaltungsort usw. zusammenfassen. Beleuchtung Sie können beim Layout und bei der Aufnahmeausrüstung sparen.
▲ Welchen Hintergrund Sie auch für den Live-Übertragungsraum wünschen, ordnen und kombinieren Sie einfach die Materialien.
Qianyu Intelligence hat übrigens eine lange Geschichte: Es wurde gemeinsam von Silicon Intelligence und der MCN-Organisation von Wei Ya und seiner Frau gegründet, wobei jede Partei 50 % der Anteile hält. Ja, das stimmt, Wei Ya ist der Wei Ya, der einst so berühmt war wie Li Jiaqi.
Nicht nur in China erfreuen sich KI-Anker auch in Südostasien großer Beliebtheit. Laut Huxius Bericht entspricht das monatliche Gehalt eines indonesischen Moderators dem einer maßgeschneiderten digitalen Person, die rund um die Uhr arbeitet. Wenn Sie der Chef wären, wen würden Sie wählen?
Das Image von KI-Ankern ist ebenfalls kontrollierbar und sie werden weder Steuern hinterziehen noch weglaufen oder alleine fliegen. Die Beherrschung mehrerer Sprachen ist eine Grundkompetenz von KI-Moderatoren, und das ist genau das, was grenzüberschreitende E-Commerce-Unternehmen wollen. Sie müssen nicht hart arbeiten, um lokale Live-Broadcast-Talente zu finden.
Auch ihre Mängel liegen auf der Hand: Obwohl sie nicht zu schmerzhaft, nicht zu ermüdend und nicht emotional gebrochen sind, sind die Reden nicht interessant, die Bilder immer noch rau und die Interaktion mit dem Publikum nicht natürlich genug.
Daher tendieren Unternehmen dazu, KI-Anker an Randpositionen zu platzieren. Schließlich ist es in Ordnung, sie Artikel auswendig lernen zu lassen, um Produkte vorzustellen und Gutscheine auszugeben, aber Produkte, die Wert auf Erfahrung legen, wie Schönheit, Kleidung und Möbel, werden wahrscheinlich nicht funktionieren.
KI-Anker eignen sich derzeit besser dazu, während der Müllzeit zu erscheinen, um die Live-Übertragungszeit auszugleichen, oder in lokalen Live-Übertragungsräumen zu leben, die 12 bis 24 Stunden dauern. Sie können Benutzer mit sich wiederholenden Wörtern bombardieren und Benutzer zum Gruppenkauf anleiten Coupons. Jeder kommt und geht in Eile und hat keine Zeit zum Nachdenken. Unterscheiden Sie zwischen wahr und falsch.
Wird das Muster geöffnet, eignen sich KI-Anker auch als digitale Avatare von Meinungsbloggern. Sie sitzen hinter einem Holztisch und reden, mit tiefgründiger Miene und professionellen Gesten. Sie müssen weder mit dem Publikum interagieren noch ihre Bewegungen ständig anpassen. Sie Sein unverwechselbares Temperament strahlt unermüdlich das Licht des Wissens aus.
Auch die Art und Weise, wie Plattformen, die riesige Live-Übertragungsräume verwalten, KI-Moderatoren sehen, gibt Unternehmen Anlass zur Sorge.
Im August dieses Jahres brachte Kuaishou das digitale AIGC-Produkt „Kuaishou Zhibo“ auf den Markt. Im Gegensatz dazu ist Douyins Haltung gegenüber KI etwas vage. Das Unternehmen veröffentlichte im Mai Plattformspezifikationen im Zusammenhang mit der KI-Generierung, von denen einige Auswirkungen auf die Zukunft der KI-Anker haben.
- Verlage sollten KI-generierte Inhalte deutlich kennzeichnen.
- Bei der Verwendung virtueller menschlicher Bilder für Live-Übertragungen muss die Echtzeitinteraktion von realen Menschen gesteuert werden und eine vollständig durch KI gesteuerte Interaktion ist nicht zulässig.
- KI-generierte Inhalte haben keine besonderen Verkehrsvorteile. Douyin legt mehr Wert auf die Qualität der Inhalte selbst.
Das ist sehr interessant. Douyin schränkt KI-Liveübertragungen nicht ein, aber der Inhalt von KI-Ankern ist im Allgemeinen nicht so gut wie der von echten Menschen. Wenn er sich überall verbreitet, schadet er auch der Plattformökologie. Daher bedeutet billig angesichts der Algorithmusregeln nicht gleichbedeutend mit Kosteneffizienz.
Der Effekt ist nicht gut, aber das Risiko ist nicht gering. In Berichten von Metropolis Express und Yibang Power wurde beide erwähnt, dass KI-Moderatoren von Videoplattformen als „aufgezeichnete Übertragungen“ oder „Nicht-Live-Übertragungen“ erkannt werden könnten, was zu Verstößen oder Kontosperrungen führen könne.
Daher entscheiden sich einige Unternehmen für eine Kompromissmethode, die Aufzeichnung und Live-Übertragung kombiniert, oder für die Live-Übertragung mit zwei Kameras, bei der KI und echte Menschen zusammengebracht werden, um eine weniger ermüdende Arbeit zu erreichen, bei der eine die mündliche Übertragung in einer Schleife wiederholt und bei der anderen Produkte interagiert und anzeigt.
Diese Händler sind sich auch darüber im Klaren, dass KI-Moderatoren Live-Übertragungen nur dabei helfen, einen Teil der Kosten für Personal und Ausrüstung einzusparen. Live-Streaming ist jedoch ein komplexes System, und das menschliche Team dahinter muss auch um Betrieb, Produktauswahl und Lieferfähigkeiten kämpfen. und die Ausrüstung hinter den Kulissen. Die zentrale Kontrolle sieht die Situation optimistisch, und es ist unmöglich, ein unauffälliger Ladenbesitzer zu sein.
Nach Angaben digitaler Menschen und Unternehmen ist das Transaktionsvolumen von KI-Ankern natürlich nicht schlechter als das realer Menschen oder sogar besser. Hervorragende Fälle werden auf ihren offiziellen Social-Media-Konten und auf digitalen Konferenzen auf der ganzen Welt beworben.
Immer mehr Händler, die es unbedingt ausprobieren möchten, zögern, ob KI-Anker die Konversionsraten und den GMV verbessern können, ob sie den Ton der Marke beeinflussen und ob sie Vertrauen beim Publikum aufbauen können.
Wer digitale Menschen nutzt, tappt noch, während diejenigen, die digitale Menschen verkaufen, bereits Geld verdienen.
Wenn Sie beiläufig auf Xianyu suchen, können Sie eine Reihe wilder Agenten finden, die öffentliche Modelle und Betriebsdienste zu niedrigen Preisen verkaufen. In der Einleitung heißt es: „Generieren Sie unbegrenzt viele Videos“, „Machen Sie Live-Übertragungen einfacher“, „Verdienen Sie 20.000 pro Monat, ohne Ihre zu zeigen.“ face“ „Ein unverzichtbares Tool zum Erstellen kurzer Videos.“
Es scheint, dass alles bereit ist, nur noch wenige Menschen sind übrig, um finanzielle Freiheit zu erlangen. Genau wie das ursprüngliche Yuanverse scheint dies eine weitere Geschichte zu sein, in der Schweine im Wind fliegen können.
Es überrascht nicht, dass die von der öffentlich-rechtlichen Agentur „Shenxiang“ befragten Technologiehersteller und Einzelverkäufer neben dem Verkauf von Produkten auch Agenturdienstleistungen empfahlen. Es scheint, dass Zwischenhändler, die den Unterschied machen, größere Aussichten haben als digitale Live-Übertragungen.
Der Zusammenbruch von Li Jiaqi und die Ernüchterung des Hauptankers
Unabhängig davon, ob Sie die Live-Übertragung sehen oder nicht, ist dies ein riesiger Markt, in dem fast 500 Millionen Internetnutzer Dinge im Live-Übertragungsraum kaufen.
Die persönliche IP von Top-Ankern ist viel bekannter als die Marken, die sie anpreisen.
Manche Moderatoren sind wie alte Freunde, die sie begleiten, wie zum Beispiel Li Jiaqi, der einst mit „all girls“ anfing und persönlich Lippenstiftfarben anprobierte.
Einige Moderatoren sind interessante und neugierige Komiker, wie zum Beispiel Bruder Yang, der „Waren rückwärts verkauft“ und „gewalttätig testet“.
Bei manchen Ankern hat man das Gefühl, etwas gelernt zu haben, etwa bei Dong Yuhui, der Englisch unterrichtet, während er Waren ausliefert.
Die Farce zwischen Li Jiaqi und Hua Extrem hohe Provisionen und Sendegebühren sowie ein Preiskontrollsystem, das exklusive Preise festlegt, zwingen Menschen dazu, Dinge im Live-Übertragungsraum zu kaufen, was wiederum die Markenentwicklung einschränkt und die Lieferkette der Branche weniger gesund macht.
Auch wenn so etwas nicht passiert, wird das Live-Streaming desillusioniert.
Einerseits hat sich die Blase in der Branche aufgelöst und sie ist immer rationaler geworden. Statistiken von iiMedia Research aus dem ersten Quartal dieses Jahres zeigen, dass in Städten wie Hangzhou, Shanghai und Peking das durchschnittliche Monatsgehalt von Moderatoren im Vergleich zum Vorjahreszeitraum um etwa 30 % gesunken ist, und „unterstützende Rollen“ wie z da auch der Betrieb und die zentrale Steuerung um etwa 20 % zurückgegangen sind.
Andererseits löst sich das Live-Übertragungsmuster langsam auf, wodurch der persönliche Einfluss großer Moderatoren geschwächt wird, eine diversifizierte Ankermatrix aufgebaut wird und der Live-Übertragungsraum selbst zu einer Marke wird.
Am ersten Tag nach Double Eleven im Jahr 2022 kündigte Li Jiaqi die Eröffnung eines neuen Live-Übertragungsraums „All Girls“ an, der von den beliebten Moderatoren und Li Jiaqi-Live-Übertragungsraumassistenten Wangwang und Qingzi eröffnet wird.
Die ehemalige „Live-Übertragungsschwester“ Wei Ya, die sich hinter die Kulissen zurückgezogen hat, betreibt auch ihre eigene Marke Qianxun, erfindet die „Wei Ya der zweiten Generation“ neu, baut ihre eigenen Bekleidungs- und Make-up-Marken auf und entwickelt das Geschäft mit digitalen menschlichen Live-Übertragungen.
Marken möchten nicht länger Brautkleider für Top-Moderatoren herstellen, sondern stattdessen mehr physische Geschäfte offline eröffnen und die Online-Selbstdarstellung der Marke nutzen, um direktere Verbindungen zu den Nutzern aufzubauen. Douyin hat auch die Eigenwerbung von Markenhändlern durch Traffic-Tilting und jährliche Rabatte unterstützt.
Wir müssen jedoch zugeben, dass der Wert von Top-Moderatoren immer noch unersetzlich ist und Live-Streaming immer noch eine Branche ist, die von Moderatoren unterstützt wird. Li Jiaqi, der Millionen von Followern auf Weibo verloren hat, verzeichnet immer noch steigende Umsätze. Die Zahl der Zuschauer liegt immer noch bei über 10 Millionen und der Verkehr ist noch stärker als sonst.
Wenn Top-Anker 80 % der Leistung beisteuern, sind es von den KI-Ankern die riesigen, unbekannten „kleinen Transparente“ mit Monatsgehältern von mehreren Tausend und noch geringerem Return on Investment, die davon betroffen sind.
Das ist schon ein großes Kinderspiel. Sima Huapeng, Gründerin von Silicon Intelligence, wies einmal darauf hin, dass mehr als 95 % der Unternehmen in der Branche tatsächlich Flat- und Store-Sendungen durchführen und viele Moderatoren nur Skripte lesen und beiläufig auf Fragen antworten können.
KI-Streamer müssen einfach besser und günstiger sein als sie. Kleine und mittlere Marken, die es sich nicht leisten können, Li Jiaqi zu engagieren, können Live-Übertragungen oft selbst durchführen.
Kleine und mittlere Marken stehen jedoch nicht nur vor dem Mangel an Ankern, sondern müssen auch mit den Regeln der Plattform, der Verkehrsförderung neuer Produkte, der künstlichen Schaffung beliebter Produkte und der Hauptsendezeit im Internet konkurrieren Einkaufen. Dies sind Leitern, die schwieriger zu erklimmen sind und für umständliche Schlachten schwieriger zu besteigen sind.
schrecklich! In dem 200 Quadratmeter großen Büro in Hangzhou ist niemand. Es sind alles digitale KI-Menschen, die 24 Stunden am Tag live übertragen.
Dieses kurze Video wurde einst weit verbreitet. Begleitet von seltsamen Hintergrundgeräuschen schwenkte die Kamera nach links und rechts, und die aufgestellten Monitore waren voller digitaler Menschen, die live Waren trugen und mit geschulten Gesten und Stimmen Produkte auf dem Bildschirm empfahlen. Tausende Lichter an dieses Ende.
In naher Zukunft werden vielleicht noch weitere Büros geräumt. Wenn ein bestimmter Moderator an einer Veranstaltung teilnimmt, verkauft sein digitaler Klon möglicherweise gleichzeitig Waren im Live-Übertragungsraum.
Alle digitalen Unternehmen sprechen davon, Live-Übertragungen für kleine und mittlere Marken anzubieten, um Menschen von sich wiederholenden Dingen zu befreien. Wenn KI digitale Arbeit stapelweise reproduziert, müssen wir zunehmend darüber nachdenken, wie viel kreative Arbeit den Menschen noch bleibt.
# Willkommen beim offiziellen öffentlichen WeChat-Konto von aifaner: aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich zur Verfügung gestellt.
Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo