Glücklicherweise hat sich Apples nationale KI nicht für DeepSeek entschieden

Glücklicherweise hat sich Apples nationale KI nicht für DeepSeek entschieden - 111 1

Wenn alle darüber rätseln, wohin die nationale KI von Apple den nächsten Schritt machen wird, ist die Antwort sowohl überraschend als auch vernünftig. Nicht der Lebhafteste, nicht der Lauteste, auch nicht derjenige mit der stärksten Opposition, sondern der Zurückhaltendste – Ali.

Laut ausländischen Medien The Information hat Apple schließlich Alibaba als Partner für die chinesische Version von KI ausgewählt.

In dem gestern Abend veröffentlichten Artikel ist uns auch im Kommentarbereich die Polarisierung der Einstellungen unter den Internetnutzern aufgefallen. Einige Leute denken, dass Alibaba der beste Kandidat ist und dies auch verdient hat, während andere verwirrt sind, dass Apple DeepSeek umgangen und sich für Alibaba entschieden hat.

Aber wenn man auf den gesamten Auswahlprozess zurückblickt, ist es vielleicht nicht unfair, dass DeepSeek von Apple aufgegeben wurde.

Glücklicherweise hat sich Apples nationale KI nicht für DeepSeek entschieden - 3 8

Was ist das Niveau des Ali-Qwen-Modells?

Unter den vielen großen KI-Unternehmen ist Alibaba wahrscheinlich das geheimnisvollste.

Oft ist dies nicht unbedingt ein Nachteil. In der sich ständig verändernden KI-Branche ist „nicht sexy genug“ manchmal der größte Vorteil, denn die andere Seite bedeutet oft, bodenständig zu sein.

Was die Kerndimension der technischen Stärke angeht, ist die Open-Source-Community wie ein Spiegel, der die wahre technische Stärke widerspiegeln kann. Alibaba ist einer der wenigen heimischen Hersteller, die diesem Spiegel standhalten können.

Dies geht aus der neuesten Open-Source-Großmodellliste von Hugging Face, der weltweit größten Open-Source-KI-Community, hervor. Die zehn besten Open-Source-Großmodelle sind alle abgeleitete Modelle, die auf dem sekundären Training des Qwen-Open-Source-Modells von Alibaba basieren.

Glücklicherweise hat sich Apples nationale KI nicht für DeepSeek entschieden - 4

Diese Liste ist derzeit die maßgeblichste Open-Source-Liste für große Modelle der Welt. Ihre Testdimensionen umfassen Leseverständnis, logisches Denken, mathematische Berechnungen, faktenbasierte Fragen und Antworten usw.

Eine weitere unbestreitbare Tatsache ist, dass der Wert des Aufbaus einer Technologiemarke immer noch steigt. Das gefeierte und beliebte Qwen-Großmodell hat Llama überholt und ist zum von der Open-Source-Community anerkannten Benchmark-Basismodell geworden.

Als branchenweit erstes Open-Source-Großmodell, das „Vollgröße, Vollmodus und mehrere Szenarien“ bietet, bietet das Alibaba Cloud Qwen-Modell Entwicklern und Unternehmen Größen und Versionen von 1,5 Milliarden bis 72 Milliarden und sogar 110 Milliarden, wodurch die Anforderungen verschiedener Anwendungsszenarien vollständig erfüllt werden.

Unter ihnen wurden allein die visuell verstehenden Modelle Qwen-VL und Qwen2-VL weltweit mehr als 32 Millionen Mal heruntergeladen. Vor einer Woche läutete Qwen2.5-VL ein neues Upgrade ein, das erneut die Begeisterung der Open-Source-Community entfachte.

Die Daten sprechen für sich. In der Open-Source-Modellliste 2024 von Hugging Face ist Qwen2.5-1.5B-Instruct mit einem Download-Anteil von 26,6 % das beliebteste Open-Source-Modell unter globalen Entwicklern.

Derzeit liegt die Zahl der von Qwen abgeleiteten Modelle bei über 90.000, was es zur größten Open-Source-Modellgruppe der Welt macht.

In der technologischen Welle von Inferenzmodellen hat Qwen ein starkes Gravitationsfeld nachgewiesen. Kürzlich verbrauchte das vom Team von Li Feifei trainierte s1-Inferenzmodell, das als „Godmother of AI“ bekannt ist, weniger Ressourcen und Daten. Es basiert ebenfalls auf dem Qwen-32B-Destillationsmodell und hat die Ergebnisse des Benchmarkings von OpenAI o1-Preview in mehreren Funktionen erzielt.

Glücklicherweise hat sich Apples nationale KI nicht für DeepSeek entschieden - 5 5

Diese Erfolge sind alle auf die hervorragende Grundstärke des Qwen-Modells zurückzuführen, aber es ist auch diese Stärke, die Alibaba das Selbstvertrauen gibt, die hohen Standardanforderungen von Apple an KI-Funktionen zu akzeptieren.

Darüber hinaus liegen die Vorteile von Alibaba als etablierter KI-Riese im Vergleich zu anderen KI-Start-ups auf der Hand. Das Unternehmen ist besser mit den Bedürfnissen der inländischen Nutzer vertraut und verfügt über ein besseres Verständnis der Daten-Compliance-Richtlinien. Diese bieten wichtige Garantien für die lokale Anpassung und schnelle Implementierung der KI-Funktionen.

Obwohl Ali am Ende gewann, war dieses Ergebnis natürlich nicht von Anfang an vorhersehbar. In den letzten Monaten hat Apple mehrere Inspektionsrunden bei einer Reihe von Kandidatenunternehmen durchgeführt, darunter Tencent, ByteDance und DeepSeek.

Glücklicherweise hat sich Apples nationale KI nicht für DeepSeek entschieden - 6 4

In einer kürzlichen Telefonkonferenz zu den Ergebnissen lobte Apple-CEO Tim Cook DeepSeek.

Cook wies darauf hin, dass DeepSeek bedeutende Innovationen bei der Reduzierung der Schulungs- und Betriebskosten für das V3-Modell erzielt hat. Er betonte, dass Innovation, die die Effizienz fördert, eine sehr positive Sache sei, was DeepSeek bewiesen habe.

Aufgrund der fehlenden Teamgröße und der großen Erfahrung im Kundenservice ist es jedoch nicht verwunderlich, dass DeepSeek aus dem Spiel ist. Dies spiegelt sich in der Meldung „Server ist ausgelastet, bitte versuchen Sie es später erneut“ wider. Im Gegensatz dazu bieten das technische Chassis und die Infrastruktur von Alibaba Cloud Apple deutlichere Vorteile bei der Bereitstellung lokalisierter Rechenleistungsunterstützung.

Glücklicherweise hat sich Apples nationale KI nicht für DeepSeek entschieden - 8 3

Noch wichtiger ist, dass Apple durch die Zusammenarbeit mit Alibaba KI-Funktionen (wie intelligente Stimme, visuelles Verständnis usw.) einführen möchte, die den Gewohnheiten chinesischer Benutzer entsprechen, die Wettbewerbsfähigkeit der Produkte verbessern und den Marktrückgang umkehren.

Berichten zufolge hofft Apple mit klaren Zielen darauf, einen Partner zu finden, der die Bedürfnisse chinesischer Nutzer anhand der persönlichen Daten der Nutzer verstehen kann, was auch ein wichtiger Bestandteil bei der Entwicklung von Apple-Smartphones ist.

Als Apple von mehreren chinesischen Unternehmen entwickelte KI-Modelle evaluierte, war es unzufrieden mit der Fähigkeit der Modelle, die Benutzerabsichten zu verstehen und die tatsächliche Telefonnutzung des Benutzers in die generierten Antworten einzubeziehen.

Ob es der Prüfung kritischer Augen und dem Test harter Szenarien standhalten kann, Apples Wahl von Alibaba für seine nationale KI könnte die beste Antwort auf diese Frage sein und es ist auch die beste Zertifizierung der Stärke von Qwen.

Nach der Nutzung von Qwen auf dem iPhone werden diese Erlebnisse neu gestaltet

Als die Mobiltelefonindustrie eine neue Runde technologischer Veränderungen einläutete, traf Liu Zuohu, Chief Product Officer von OPPO, letztes Jahr auf der AI-Strategiekonferenz von OPPO ein wichtiges Urteil: „KI-Mobiltelefone werden nach Feature-Phones und Smartphones die dritte große Veränderungsstufe in der Mobiltelefonbranche sein.“

Die Entwicklung von KI-Mobiltelefonen wird in drei Phasen beschrieben: Die erste ist die KI auf Anwendungsebene, die einzelne Anwendungen intelligenter macht.

Einschließlich der jüngsten Beliebtheit von Deepseek wird die Anwendungsform von KI im Mobiltelefonbereich immer deutlicher. Mobiltelefonhersteller übernehmen im Allgemeinen die Lösung „Geräte-Cloud-Kollaboration“: Leichte Aufgaben werden lokal auf dem Mobiltelefon verarbeitet und komplexe Aufgaben werden in die Cloud übertragen.

Glücklicherweise hat sich Apples nationale KI nicht für DeepSeek entschieden - 9 4

Auch Apple Smart demonstrierte nach der WWDC-Konferenz im letzten Jahr eine ähnliche Schichtarchitektur:

  • Lokales Modell: Hauptsächlich ein kleines 3B-Modell, das für Aufgaben wie Zusammenfassung und Polieren optimiert wurde. Mit der Unterstützung des Adapters sind seine Fähigkeiten nicht schwach.
  • Privates Cloud-Computing: Wenn das lokale Modell die Anforderungen nicht erfüllen kann, wird es zur Berechnung in die Cloud übertragen. Apple sorgt für eine Ende-zu-Ende-Verschlüsselung, um die Sicherheit und Privatsphäre der Benutzerdaten zu schützen
  • LLM von Drittanbietern: Wird für allgemeine Frage- und Antwort-Chats verwendet. Anwendungen wie Siri sind mit externen Modellen wie ChatGPT verbunden.

Wenn nichts Unerwartetes passiert, wird das Qwen-Modell in der jüngsten Zusammenarbeit mit Alibaba wahrscheinlich in zwei Formen in das iPhone-Ökosystem integriert. Erstens handelt es sich im Wesentlichen um eine Plug-in-Form, die als LLM eines Drittanbieters umfassende KI-Dienste bereitstellt.

Diese Strategie steht im Einklang mit Apples Ansatz zur Integration von ChatGPT in ausländischen Märkten. Doch ebenso wie die Zusammenarbeit mit OpenAI nicht exklusiv ist und Modelle wie Google Gemini oder Claude in Zukunft möglicherweise in ausländische iPhones integriert werden, könnten auch mehr im Inland produzierte KI-Modelle auf dem heimischen Markt eingeführt werden.

Die zweite besteht darin, mit Alibaba zusammenzuarbeiten, um eine destillierte Version des kleinen Modells bereitzustellen und zu entwickeln. Im Gegensatz zu DeepSeek V3/R1, das sich auf das ultragroße Modell 671B konzentriert, verfolgt Qwen einen ganzheitlichen Ansatz. Selbst das berühmte DeepSeek-Unternehmen hat sich dafür entschieden, vier seiner sechs Open-Source-Destillationsmodelle auf Basis von Qwen zu bauen, was an sich die beste Bestätigung der technischen Stärke von Alibaba ist.

Glücklicherweise hat sich Apples nationale KI nicht für DeepSeek entschieden - 10 3

Als Exkurs: Obwohl Deepseek Janus-Pro-7B veröffentlicht hat, ein multimodales Modell, das OpenAI DALL·E 3 übertrifft, unterstützt DeepSeek derzeit keine multimodalen Funktionen auf der C-Seite. Und Qwen ist wirklich gut, wenn andere es nicht haben, und es ist nicht schlecht, wenn andere es haben. Das neu veröffentlichte Qwen 2.5 Max gehört auch zu den wettbewerbsfähigsten multimodalen Modellen der Spitzenklasse.

Es ist erwähnenswert, dass es auch Durchbrüche in der Modellkomprimierungstechnologie gibt. Im Jahr 2024 haben chinesische Hersteller erhebliche Fortschritte bei der Optimierung von KI-Modellen gemacht und dabei die neueste Quantifizierungs- und Bereinigungstechnologie eingesetzt, um die Parameterskala erheblich zu rationalisieren und gleichzeitig die Ausgabequalität sicherzustellen.

Laut Canalys hat beispielsweise Xiaomis MiLM2 seine Modellparameter von 6 Milliarden auf 4 Milliarden reduziert, während Honor und vivo ihre Modellparameter ebenfalls von zuvor 7 Milliarden auf 3 Milliarden reduziert haben. Tongyi Qianwen verwendet außerdem strukturiertes Bereinigen, um das 7B-Parametermodell auf 2,2B zu komprimieren und gleichzeitig erhebliche Verständnis- und Generierungsfähigkeiten beizubehalten.

Glücklicherweise hat sich Apples nationale KI nicht für DeepSeek entschieden - 11 5

Auf Toolebene unterstützen Apples Core ML Tools auch die Quantifizierung von Modellgewichten, wodurch die Standardgenauigkeit von Float 32 auf Float 16, 8 Bit, 7 Bit oder sogar 1 Bit reduziert werden kann. Dies reduziert nicht nur den Speicherplatz und den Rechenressourcenverbrauch des Modells erheblich, sondern verbessert auch die Stabilität des Inferenzprozesses und die Zuverlässigkeit der Ergebnisse.

Der Quantisierungsprozess ändert nichts an der Präzision der Zwischentensoren, die normalerweise auf der Genauigkeit von Float 32 oder Float 16 gehalten werden, und die Gewichte werden zur Laufzeit dequantisiert, um sie an die Präzision der Zwischentensoren anzupassen, wodurch die Genauigkeit der Inferenzergebnisse verbessert wird.

Bereits im letzten Jahr erreichte Apples 3B-Modell, das auf dem iPhone 15 Pro läuft, durch eine Reihe von Optimierungstechnologien, darunter Low-Bit-Planierung, Aktivierungsquantisierung, Einbettungsquantisierung, effizientes KV-Cache-Update und die Verwendung von Talaria-Tools zur Latenz- und Stromverbrauchsanalyse, eine Verzögerung von nur 0,6 Millisekunden für den ersten Token und konnte 30 Token pro Sekunde generieren, was für ein reibungsloses Erlebnis sorgt.

Das ultimative Ziel der Apple Intelligence besteht natürlich darin, einen echten KI-Assistenten auf Systemebene zu schaffen.

Kleine Modelle sind der Schlüssel und Ökologie ist der ultimative Trumpf. Das Ökosystem von Alibaba umfasst E-Commerce, Zahlung, lokale Dienste und Unterhaltung. Nach einer intensiven Zusammenarbeit mit iPhone AI können Benutzer in Zukunft möglicherweise den gesamten Servicebuchungsprozess nahtlos mit einfachen Sprachbefehlen abschließen. Es wird sogar erwartet, dass Ressourcen von Unternehmen wie DingTalk genutzt werden, um Anwendungsszenarien weiter zu erweitern.

Der Wettbewerb unter KI-Mobiltelefonen verlagert sich von einem rein technischen Wettbewerb zu einem Wettbewerb um ökologische Integration und Benutzererfahrung. Hersteller müssen in den drei Dimensionen lokale Rechenleistung, Cloud-Fähigkeiten und ökologische Synergien zusammenarbeiten, um KI-Telefone zu entwickeln, die Benutzer wirklich beeindrucken.

Der Marktresonanz nach zu urteilen, hat diese Zusammenarbeit die Erwartungen weit übertroffen. Ob es nun die Popularität von DeepSeek oder die „Hochzeit“ zwischen Apple und Alibaba ist, dieser Satz trifft zu: Ein echter Meister ist wie ein Fluss, der nach Osten fließt, scheinbar ruhig und still, in dem sich jedoch große Macht verbirgt.

# Willkommen beim offiziellen öffentlichen WeChat-Konto von aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo