Getestet Huawei Xiaoyi Version von DeepSeek, gibt es einen Unterschied zur Vollblutversion von R1?

Februar 6, 2025 Eskere Guru

Während des Frühlingsfestes sind nicht die Frühlingsfest-Gala-Skizzen oder die Frühlingsfest-Filme die beliebtesten Dinge im Internet, sondern DeepSeek.

Dieses dunkle Pferd der KI aus China hat eine mit OpenAI o1 vergleichbare Leistung bei extrem niedrigen Schulungskosten erzielt. Mit seinen starken chinesischen Sprachkenntnissen, einem erwachenden Moment im Internet und seinem Open-Source-Geist hat es den von ChatGPT angeführten KI-Kreis schnell aufgewühlt.

Wenn die eigene Familie erfolgreich wird, müssen andere Familienmitglieder für sich selbst sorgen. Während also die Menschen im ganzen Land schöne Feiertage genießen, sind die Programmierer wieder beschäftigt.

Als Tencent Cloud, MiTa AI, Alibaba Cloud, Baidu Smart Cloud und die National Supercomputing Internet Platform ihren Zugang zu DeepSeek angekündigt haben, haben auch Mobiltelefone als das am häufigsten verwendete persönliche Smart-Terminal ihre Präsenz eingeläutet.

Unter ihnen ist Huawei der Schnellste.

Da gibt es nicht viel zu sagen, da DeepSeek das erste Gerät ist, das in ein Smartphone integriert wurde, haben wir sofort einen praktischen Test durchgeführt, um zu sehen, wie es tatsächlich funktioniert.

Nach dem Upgrade von Xiaoyi Assistant auf Version 11.2.10.310 ist DeepSeek offiziell im Agent Plaza von Xiaoyi Assistant erschienen.

Rufen Sie die Hauptoberfläche der Xiaoyi Assistant-App auf, klicken Sie in der Navigationsleiste auf „Entdecken“ und Sie können die Existenz von DeepSeek auf einen Blick erkennen. Dem Cover nach zu urteilen, handelt es sich bei dem derzeit verbundenen DeepSeek um die Beta-Version von R1.

Im Vergleich zur offiziellen Anwendung behält die mit Huawei Xiaoyi verbundene DeepSeek-R1 Beta im Allgemeinen den einheitlichen Designstil und die Logik von Xiaoyi Assistant bei. Die Benutzeroberfläche ist einfach und intuitiv und in einen oberen und einen unteren Teil unterteilt.

Die erste Hälfte ist eine Selbstvorstellung von DeepSeek-R1 Beta und zeigt einige voreingestellte häufige Probleme, die Erstbenutzer auswählen und ausprobieren können. Der untere Teil ist ein Dialogfeld, das die Spracheingabe unterstützt. Der Sprachinhalt des Benutzers wird automatisch in Text umgewandelt und sofort gesendet, was praktisch und schnell ist.

▲ Links: Xiaoyi-Version von DeepSeek / Rechts: Offizielle DeepSeek-Anwendung

Klicken Sie auf den Avatar von DeepSeek-R1 Beta, um die Detailseite aufzurufen, die eine detailliertere Einführung enthält:

Ich bin ein Agent, der auf der Open-Source-Version von DeepSeek basiert und Hongmeng-Benutzern dabei helfen soll, ein tiefes Denkerlebnis zu erlangen.

Darüber hinaus unterstützt die Xiaoyi-Version von DeepSeek-R1 Beta nur einfache Einstellungen, einschließlich des Agenten-Timbres, des Löschens von Kontext und des Löschens von Gesprächsaufzeichnungen. Das bedeutet, dass Sie kein neues Dialogfeld öffnen können, sondern nur den Kontext löschen und Gesprächsaufzeichnungen löschen können.

▲ Die reichhaltigste Einstellung ist tatsächlich Xiaoyis eigener Ton

Bevor der ausführliche Test beginnt, haben wir noch einige Vorsichtsmaßnahmen und Details, die Sie vorab wissen müssen:

DeepSeek-R1 Beta, auf das Huawei Xiaoyi zugreift, ist nur in der reinen Hongmeng-Version von Xiaoyi Assistant verfügbar. Benutzer von Hongmeng 4.3 können es vorübergehend nicht genießen.
Die Xiaoyi-Version von DeepSeek unterstützt mit ihrer Signaturfunktion tiefgreifendes Denken, bietet jedoch keinen detaillierten Denkprozess
Die Xiaoyi-Version von DeepSeek bietet derzeit keine Option für die Internet-Suchfunktion im Dialogfeld, aber manchmal werden in der Antwort verweisende Online-Webseiten angezeigt.
Die Xiaoyi-Version von DeepSeek bietet nach Beantwortung der Fragen einige Erweiterungsoptionen, um Benutzer auf weitere Fragen vorzubereiten. Dies ist in der offiziellen Anwendung nicht verfügbar.

Die Kontextlänge ist etwas kurz, ausreichend für den täglichen Gebrauch

Bei der Messung der Leistung von KI gibt es einen wichtigen Faktor – die lange Kontextlänge.

Die Kontextlänge (Kontextlänge) bezieht sich auf die Textlänge, die ein großes Sprachmodell bei der Textverarbeitung gleichzeitig berücksichtigen und merken kann.

Wenn die Kontextlänge eines Modells beispielsweise 2048 Token beträgt, kann es beim Generieren oder Verstehen von Text nur Informationen bis zu 2048 Token „sehen“, und Informationen über diese Länge hinaus werden vom Modell ignoriert oder gehen verloren.

Mit anderen Worten: Wenn der Kontext nicht lang genug ist, vergisst die KI möglicherweise, was Sie zuvor beim Chatten gesagt haben.

Obwohl die von Xiaoyi aufgerufene DeepSeek-R1-Beta die Kontextlängendaten nicht offenlegt, können wir eine einfache Methode für vorläufige Tests entwerfen.

Ich habe die ersten drei Kapitel von „The Romance of the Three Kingdoms“ vorbereitet, etwa 15.000 Wörter, sie in DeepSeek-R1 eingegeben, das mit Huawei Xiaoyi verbunden ist, und es gebeten, die letzten 100 Wörter auszugeben.

Nachdem DeepSeek-R1 viele Male mit Huawei Xiaoyi verbunden war, wurden alle Eingabeaufforderungen angezeigt:

Warten Sie einen Moment, warten Sie einen Moment und versuchen Sie es erneut.

Als ich den Artikel auf das erste Kapitel, etwa 4.500 Wörter, kürzte, scheiterte er immer noch.

In meiner Verzweiflung änderte ich eine Pressemitteilung, die ich geschrieben und etwa 700 Wörter Inhalt extrahiert hatte, und bekam schließlich eine erfolgreiche Ausgabe.

Diese Länge reicht im Grunde aus, um über einfache Alltagsthemen zu kommunizieren, aber wenn Sie mit ihm über das Leben plaudern möchten, sind Sie vielleicht ein Philosophielehrer, der zu Amnesie neigt.

Gibt es einen Unterschied zwischen der Ausgabequalität und der Vollversion von R1?

Es ist an der Zeit, dass alle wieder davon erfahren. Seit der Entwicklung der KI gibt es verschiedene Testmethoden. Wir haben eine Reihe von Fragen ausgewählt, von solchen, die für Menschen leicht zu verstehen, aber für die KI leicht missverständlich sind, bis hin zur Machbarkeit, auf alltägliche Bedürfnisse zu reagieren, und detaillierte Tests durchgeführt.

Als klassische Fragen, die einst die meisten KI-Communitys verärgerten, wurden „Was ist größer, 9.11 oder 9.8?“ und „Wie viele Rs gibt es in Strawberry?“ in die regulären Testsitzungen integriert.

▲ Links: Xiaoyi-Version von DeepSeek / Rechts: Offizielle DeepSeek-Anwendung

Überraschenderweise überschlug sich bei der Frage, wie viele Rs es in Strawberry gibt, die mit Huawei Xiaoyi verbundene DeepSeek-R1-Beta. Selbst als die Referenzquelle angegeben wurde, gab sie immer noch die Antwort auf zwei Rs, und es gab auch einen Fehler an der Position, an der r auftauchte.

Es gibt keine Überraschungen in der offiziellen Anwendung von DeepSeek, die nicht nur die richtige Antwort gibt, sondern auch die Position von r genau angibt.

Darüber hinaus weist DeepSeek in Verbindung mit Huawei Xiaoyi im Vergleich zur offiziellen Anwendung einen weiteren wesentlichen Unterschied auf: Der Denkprozess des R1-Modells ist verborgen.

Obwohl dieser Prozess die Antwort meistens nicht beeinträchtigt, macht eine KI, die den Denkprozess demonstrieren kann, die Menschen offensichtlich sicherer. Wenn der Benutzer die Frage anpassen möchte, kann er gleichzeitig zum Verständnis beitragen, indem er die von der KI angezeigte Denklogik betrachtet, um zu verhindern, dass die KI das Denken des Benutzers nicht genau erfasst.

▲ Nach dem Denkprozess der offiziellen Anwendung zu urteilen, gibt es mehrere Rs, mit denen die KI immer noch zu kämpfen hat.

Ich war es gewohnt, die offizielle App von DeepSeek zu verwenden, aber plötzlich verlor ich meinen Denkprozess und fühlte mich ein wenig unsicher.

Also habe ich das Trolley-Problem zwei DeepSeeks gegeben. Diese klassische Denkfrage, die sich mit moralischer Ethik befasst, testete ihr tiefes Verständnis komplexer moralischer Fragen. Sehen Sie, ob dieser Denkprozess ausgeblendet werden kann, um eine methodische und umfassende Antwort zu finden und die von mir vorgegebene Falle zu vermeiden.

In dieser Frage hat DeepSeek-R1 Beta keine Fehler gemacht und ist auch nicht in die Grube meines Entwurfs geraten. Die Konsequenzen der beiden Entscheidungen wurden in der Antwort ausführlich dargelegt und aus verschiedenen Blickwinkeln und Perspektiven detailliert analysiert. Es wurde daran erinnert, dass man, egal welche Wahl getroffen wird, ihre ethischen Implikationen, möglichen Auswirkungen und Konsequenzen sorgfältig abwägen muss.

Wenn einfache moralische und ethische Fragen nicht ausreichen, versuchen Sie es mit schwierigeren Fragen, um Ihr Denkvermögen, Ihr Urteilsvermögen und Ihr Verständnis für logische Zusammenhänge zu testen:

„An einem Ende einer Brücke stehen drei Personen. Sie müssen auf die andere Seite der Brücke gehen, aber die Brücke kann nur zwei Personen gleichzeitig überqueren, und es gibt nur eine Taschenlampe auf der Brücke. Die drei Personen überqueren die Brücke mit unterschiedlichen Geschwindigkeiten: Eine Person benötigt 1 Minute, um die Brücke zu überqueren, die andere benötigt 2 Minuten und die letzte Person benötigt 5 Minuten. Es können nur zwei Personen gleichzeitig die Brücke überqueren, und es muss eine Taschenlampe auf der Brücke geben. Frage: Wie können wir sie dazu bringen, die Brücke zu überqueren? die kürzeste Zeit?"

Dieser Test ist interessanter. Die von Xiaoyi aufgerufene DeepSeek-R1-Beta kam zu dem Schluss, dass diese Antwort mit der Schlussfolgerung von ChatGPT identisch ist, während die offizielle DeepSeek-App eine kürzere Antwort lieferte und gleichzeitig ausreichend Kontext für die Debatte in Bezug auf die Denklogik lieferte.

▲ Links: Xiaoyi-Version von DeepSeek / Mitte: offizielle DeepSeek-Anwendung / Rechts: ChatGPT-4o

Nachdem wir Ethik, Logik und Mathematik getestet hatten, haben wir schließlich einen Test getestet, der den normalen Nutzungsszenarien näher kommt, für die KI jedoch schwierig ist, natürlich zu sein – chinesisches Schreiben.

Ich habe ein Videothema entworfen und die mit Xiaoyi verbundene DeepSeek-R1-Beta gebeten, mir bei der Ausgabe einer einfachen Zeile zu helfen. Unter Berücksichtigung des Bildschirmdesigns habe ich auch das Erscheinungsbild des Huawei Mate X6-Faltbildschirms in Form einer Skizze vorgestellt, um zu sehen, wie es sich verhält, wenn Benutzer komplexe Aufgabenanforderungen stellen:

„Ich möchte ein Video über den Faltbildschirm des Huawei Mate X6 machen. Ich werde das Aussehen des Faltbildschirms zeigen und eine neutrale Bewertung abgeben.

Die von Xiaoyi aufgerufene DeepSeek-R1-Beta hat mir nach kurzer Überlegung ein komplettes Dialogzeilendesign gegeben, das insgesamt vier Szenen und ein Ende enthält, und die umgangssprachlichen Zeilen sind gut gelungen.

Es ist zu beachten, dass die Antworten, wenn keine Umgangssprache erforderlich ist, zu formell und streng sind und dennoch ein wenig an KI erinnern.

Im Allgemeinen befinden sich die Kontextlängenleistung und die Antwortgenauigkeit der derzeit mit Xiaoyi verbundenen DeepSeek-R1-Beta noch in einem relativ einfachen Zustand, der durch Faktoren wie Veröffentlichungsgeschwindigkeit, Integrationskompromisse usw. eingeschränkt sein kann, und wir müssen auf nachfolgende Iterationen warten.

Wenn man jedoch bedenkt, dass die aktuellen Verbindungsbedingungen der offiziellen DeepSeek-Website und der offiziellen Anwendungen wirklich schlecht sind und verschiedene andere Cloud-Plattformen und lokale Bereitstellungen strenge Anforderungen an die Nutzungsumgebung und den Schwellenwert stellen, ist die direkte Verwendung von DeepSeek in Verbindung mit Huawei Xiaoyi bei einigen weniger komplexen Problemen eine gute Wahl.

Zhou Yizhi (zhouyizhi)

Lass mich eine glückliche Reise haben

E-Mail 9

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo