Mit dieser heimischen Version des o1-Modells möchte ich in „Squid Game“ bis zum Ende überleben.
Wie weit sind wir von einer KI entfernt, die wie Menschen denkt?
In dem Science-Fiction-Roman „Per Anhalter durch die Galaxis“ von Douglas Adams entwirft ein Rennen in hohen Breitengraden einen Supercomputer „Deep Thought“, um Berechnungen durchzuführen, um die ultimative Antwort auf das Leben, das Universum und alles andere zu finden.
„Deep Thought“ gelangte nach 7,5 Millionen Jahren Berechnungen zur Antwort „42“.
Das Meiste an Science-Fiction ist oft Realität. Selbst die Beantwortung äußerst komplexer Fragen dauert möglicherweise nur weniger als eine Minute.
Nachdem OpenAI im September dieses Jahres das Inferenzmodell o1 veröffentlicht hatte, begannen die Menschen zu erkennen, dass die KI nach dem Streben nach „Größer“ begann, nach „Mehr Ähnlichem“ zu streben, und die Denkfähigkeit zum nächsten wichtigen Wendepunkt in der Entwicklung der KI wurde.
Heute haben wir herausgefunden, dass Zhipu, bekannt als die „chinesische Version von OpenAI“, auch ein o1-ähnliches Inferenzmodell GLM-Zero-Preview (die erste Version von GLM-Zero) auf den Markt gebracht hat.
Obwohl viele Unternehmen in den letzten Monaten Inferenzmodelle eingeführt haben, habe ich nach der Erfahrung mit GLM-Zero-Preview festgestellt, dass es immer noch etwas Neues gibt.
Wenn Sie GLM-Zero-Preview erleben möchten, ist die Methode sehr einfach.
GLM-Zero-Preview wird sofort nach der Veröffentlichung online sein und unterstützt die kostenlose Nutzung durch Zhipu Qingyan-Benutzer sowie API-Aufrufe der offenen Plattform von Zhipu. Melden Sie sich jetzt auf der Website und APP „Zhipu Qingyan“ an, geben Sie den Agenten „Zero Inference Model“ ein und laden Sie Text oder Bilder hoch, um es kostenlos zu erleben.
Darüber hinaus wurde die API von GLM-Zero-Preview gleichzeitig auch auf der intelligenten offenen Plattform bigmodel.cn gestartet.
Anbei die Erlebnisadresse:
Klare Worte der Weisheit
https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh
Offene Zhipu-Plattform
https://bigmodel.cn/dev/api/normal-model/glm-zero-preview
Vom „Tintenfischspiel“ bis zur Quantenmechanik ist diese heimische Version von o1 einfach zu handhaben
In dem beliebten koreanischen Drama „Squid Game 2“ ist ein zweihändiges Stein-Papier-Schere-Spiel ein einfaches und aufregendes Spiel. Unter dem Druck von Leben und Tod wird der Schwierigkeitsgrad zunehmen.
Aber wenn ich dieses Spiel mit GLM-Zero-Preview spiele, erhöht sich die Überlebenswahrscheinlichkeit enorm.
„Two-Handed Rock, Paper, Scissors“ ist eine komplexere Version des Spiels „Rock, Paper, Scissors“. Die Spieler beginnen mit beiden Händen, die eine beliebige Kombination aus Stein, Schere oder Papier darstellen. Nachdem der Spieler die Wahl seines Gegners gesehen hat, muss er eine davon heben Hand gleichzeitig, Überlassen Sie die endgültige Wahl.
Wie spielt man dieses Spiel, um die Gewinnwahrscheinlichkeit zu erhöhen? Die Antworten von GLM-Zero-Preview sind detailliert und praktisch und listen verschiedene optimale Lösungen zur Verbesserung der Gewinneffizienz auf.
Manchmal ist der Grat zwischen Wissenschaft und Metaphysik schmal. In diesem Jahr sind viele Tempel überfüllt. Es ist nicht schwierig, ein Visum zu beantragen, aber was soll ich tun, wenn ich das nicht möchte? Warten?
Dann können Sie GLM-Zero-Preview ausprobieren. Es ist nicht nur kostenlos und effizient, sondern die Interpretation ist auch sehr anspruchsvoll und KI ist etwas metaphysisch.
„Das siebenundsiebzigste Zeichen dafür, dass Kaiserin Lu Han Xin Zhongping Schaden zugefügt hat, hat seine Wurzeln. Sie sollten von nun an die Quelle untersuchen und nicht den Gerüchten der Passanten folgen.
Nachdem wir über Metaphysik gesprochen haben, sprechen wir über Philosophie.
Vor ein paar Jahren gab es eine beliebte Debattenfrage: „Das Kunstmuseum brennt. Ein berühmtes Gemälde oder eine Katze. Du kannst nur eines retten. Wen wählst du, nachdem du den Wert des Lebens, moralische Prinzipien usw. umfassend bedacht hast?“ emotionale Faktoren, GLM-Zero -Vorschau Priorisieren Sie Rettungskatzen.
Geben Sie die gleiche Frage immer wieder ein, und die Antworten von GLM-Zero-Preview sind immer konsistent und die Ergebnisse sind sicher und logisch konsistent.
Im Zweifelsfall gibt es die Quantenmechanik. Ist die Katze im klassischen Katzenexperiment von Schrödinger tot oder lebendig?
Beobachten Sie zunächst die Denklogik von GLM-Zero-Preview und schauen Sie sich dann die Antwort an, die es gibt: „Im klassischen Schrödinger-Katzenexperiment befindet sich die Katze in einem Überlagerungszustand von tot und lebendig, bevor die Schachtel geöffnet wird, und ihr Leben.“ und der Todeszustand wird erst durch die Beobachtung bestimmt.
Seien Sie aufmerksam und Sie können die erzielten Ergebnisse weiter zitieren und Fragen dazu stellen.
Das in der chinesischen Welt weit verbreitete „Einstein-Rätsel“ kann auch verwendet werden, um die logische Denkfähigkeit von GLM-Zero-Preview zu testen.
Es gibt fünf Häuser unterschiedlicher Farbe und jedes Haus wird von einer Person einer anderen Nationalität bewohnt. Jeder Bewohner mag unterschiedliche Getränke, raucht unterschiedliche Zigaretten und hält unterschiedliche Haustiere. Bekannt:
1. Die Briten leben in roten Häusern.
2. Schweden halten Hunde.
3. Dänen trinken Tee.
4. Das grüne Haus befindet sich links vom weißen Haus.
5. Der Besitzer des Gewächshauses trinkt Kaffee.
6. Menschen, die Pall-Mall-Zigaretten rauchen, züchten Vögel.
7. Der Besitzer des gelben Hauses raucht Dunhill-Zigaretten.
8. Norweger wohnen im ersten Haus.
9. Der Besitzer des mittleren Hauses trinkt Milch.
10. Der Blends-Raucher wohnt neben dem Katzenbesitzer.
11. Der Pferdezüchter wohnt neben dem Zigarettenraucher in Dunhill.
12. Menschen, die Blue Master-Zigaretten rauchen und Bier trinken.
13. Deutsche rauchen Prince-Zigaretten.
14. Das Haus, in dem der Norweger lebt, liegt neben dem blauen Haus.
15. Der Mann, der Blends-Zigaretten raucht, hat einen Nachbarn, der Wasser trinkt.
Die Antwort ist, dass die Deutschen Fische züchten. Ich weiß nicht, ob Sie Recht haben.
Diese schwierige Frage, die angeblich für 98 % der Menschen auf der Welt unbeantwortbar ist, konnte mit GLM-Zero-Preview problemlos gelöst werden. Aus den langwierigen Argumentationsschritten ist ersichtlich, dass die CPU von GLM-Zero-Preview schnell läuft, aber noch wach ist.
Lasst uns den Sieg weiter verfolgen und unsere Intensität steigern.
Fünf Piraten entdecken 100 Goldmünzen und jeder Pirat muss über die Verteilung der Münzen abstimmen. Bei mehr als einem Piraten werden die Goldmünzen nur dann auf diese Weise verteilt, wenn mehr als die Hälfte der Piraten mit der Verteilungsmethode einverstanden sind. Gibt es weniger als einen Piraten, nimmt er alle Goldmünzen selbst. Jeder Pirat möchte so viele Goldmünzen wie möglich behalten und gleichzeitig hoffen, am Leben zu bleiben. Pirat 1 So stellen Sie sicher, dass Sie den größtmöglichen Nutzen daraus ziehen und gleichzeitig Ihr Leben retten.
„(97, 0, 1, 0, 2)“, angesichts des Problems der Goldfreigabe durch Piraten, löste GLM-Zero-Preview es problemlos wieder.
Beim Crosstalk steht das Sprechen und Singen im Vordergrund, und es gibt einen berühmten Witz namens „Nennung des Namens des Gerichts“.
Die Frage ist also, können Sie GLM-Zero-Preview eine vegetarische Version von „Melden Sie den Namen des Gerichts“ schreiben lassen? Sagen Sie mir nicht, GLM-Zero-Preview hat nach drei Malen, fünf und zwei Malen eine neue Version herausgegeben.
GLM-Zero-Preview unterstützt übrigens auch multimodale Erkennungsfunktionen.
Nehmen Sie eine Flasche Getränk und lassen Sie GLM-Zero-Preview die Zutatenliste „scannen“. Kann es die Technologie und die harte Arbeit darin erkennen? Wir haben es mit einem Getränk versucht, das in den letzten Jahren populär wurde, und das Getränk war es auch verspottet als „Ein Schluck fühlt sich an, als würde man das gesamte Periodensystem der Elemente trinken.“
Wie erwartet listete es die Zutaten einzeln auf dem Bildschirm auf und zeigte uns dann auf Anfrage die Funktionen dieser Zutaten.
Sind Sie nicht gut in Mathe mit großen Modellen? Die heimische KI hat das nächste Level erreicht
Das Inferenzmodell GLM-Zero ist die Modellreihe von GLM, die sich auf die Verbesserung der KI-Folgefähigkeiten konzentriert. Es eignet sich gut für den Umgang mit mathematischer Logik, Code und komplexen Problemen, die tiefgehendes Denken erfordern.
Beginnen wir mit einem Problem, das sowohl einfach als auch leicht und schwer zu sagen ist: „Schachbrett und Weizenkörner“.
Wenn Weizenkörner auf einem Schachbrett platziert werden, wird 1 Weizenkorn auf das erste Schachfeld gelegt. Die Anzahl der Weizenkörner, die auf jedem weiteren Schachfeld platziert werden, ist doppelt so hoch wie die Anzahl der Weizenkörner, die benötigt werden, um alle zu füllen die Schachfelder auf dem Schachbrett?
Nach einigem Nachdenken fand GLM-Zero-Preview schließlich die richtige Antwort und demonstrierte seine leistungsstarke Rechenleistung.
In einem früheren von Apple veröffentlichten Artikel wurde darauf hingewiesen, dass große Modelle mathematische Konzepte nicht wirklich verstehen. Sobald der Frage Interferenzbedingungen hinzugefügt werden, nimmt die Genauigkeit des Modells ab. Wir haben es auch versucht.
Von „Ein Telefongespräch kostet 10 Cent pro Minute, wie viel kostet ein 60-minütiges Gespräch?“ bis „Die ersten 10 Minuten eines Gesprächs kosten 10 Cent pro Minute und dann 8 Cent pro Minute. Wie viel kostet ein 60-minütiges Gespräch?“ „Minutengesprächskosten?", kann GLM -Zero-Preview immer noch genau antworten und rechnet auch Pennys sorgfältig in Dollar um, was ein bisschen wie ein Augenzwinkern ist.
Bei komplexeren mathematischen Problemen ist GLM-Zero-Preview gleichermaßen leistungsfähig.
Lassen Sie uns zunächst mit einer echten Mathematikfrage für die Hochschulaufnahmeprüfung aufwärmen:
In der arithmetischen Folge {an}{an} gilt a1=−9a1=−9, a5=−1a5=−1. Denken Sie daran: Tn=a1+a2+…+an Tn=a1+a2+…+an, dann die Folge {Tn}{Tn} ( ).
A. Es gibt eine Höchstlaufzeit und eine Mindestlaufzeit
B. Es gibt eine Höchstlaufzeit, aber keine Mindestlaufzeit
C. Es gibt keine Höchstlaufzeit, aber eine Mindestlaufzeit
D. Keine Höchstlaufzeit, keine Mindestlaufzeit
GLM-Zero-Preview Die Wahl von C bedeutet keineswegs „C für alles zu schätzen“, sondern bietet vielmehr einen Denkprozess und eine Anleitung, die noch nützlicher ist als einige KI-Lernmaschinen.
Beamte sagten, dass bei der postgradualen Aufnahmeprüfung für Mathematik Nr. 1 im Jahr 2025 die GLM-Null-Punktzahl bei 126 lag und damit das Niveau herausragender Doktoranden erreichte.
Um korrekte Antworten sicherzustellen, aktiviert GLM-Zero-Preview außerdem automatisch einen Verifizierungsprozess.
„In der Verarbeitungswerkstatt der Maschinenfabrik sind 85 Arbeiter beschäftigt. Im Durchschnitt bearbeitet jede Person täglich 16 große Zahnräder oder 10 kleine Zahnräder. Es ist bekannt, dass 2 große Zahnräder und 3 kleine Zahnräder in einem Satz zusammenpassen. Wie viele Arbeiter.“ Müssen die großen und kleinen Zahnräder so angeordnet werden, dass die täglich verarbeiteten großen und kleinen Zahnräder genau zueinander passen?“
GLM-Zero gab schnell die Antwort: „25 Arbeiter bearbeiten das große Zahnrad, und 60 Arbeiter bearbeiten das kleine Zahnrad.“ Die Frage ist erstklassig.
Selbst wenn es ein weiteres schwieriges AMC-Problem gibt, kann es problemlos gelöst werden.
„Eine Menge besteht aus 6 (nicht eindeutigen) positiven ganzen Zahlen: 1, 7, 5, 2, 5 und X. Der Durchschnitt (arithmetisches Mittel) der 6 Zahlen entspricht einem Wert in der Menge. Alle möglichen Werte von X Wie hoch ist die Summe?“
Dieses Problem umfasst fünf Hauptpunkte und mehr als ein Dutzend Situationen. GLM-Zero-Preview berücksichtigt umfassend verschiedene Möglichkeiten und gibt sie mit einem Klick aus, was mir das Gefühl gibt, dass es wirklich menschliches Denken nachahmt.
Als erstes Inferenzmodell von GLM, das auf Basis der erweiterten Reinforcement-Learning-Technologie trainiert wurde, hat GLM-Zero-Preview in AIME 2024-, MATH500- und LiveCodeBench-Bewertungen Ergebnisse erzielt, die denen von OpenAI o1-preview entsprechen.
Darüber hinaus kann GLM-Zero-Preview auch mehrere Programmiersprachen kompetent nutzen, um Entwicklern beim Code-Debuggen beim schnellen Schreiben zu helfen, Fehler schnell zu identifizieren und detaillierte Reparaturvorschläge zu geben.
Sie müssen beispielsweise nur den Befehl „Hilf mir, ein interessantes Ego-Shooter-Spiel in HTML zu schreiben“ eingeben und GLM-Zero-Preview kann das folgende Spiel schnell und selbstständig abschließen.
Zhipu wird in Kürze die offizielle Version von GLM-Zero herausbringen, die die Fähigkeit zum tiefen Denken von der mathematischen Logik auf allgemeinere Technologien erweitert und sich weiter in Richtung AGI bewegt.
Natürlich gibt es noch viele Lücken zwischen der aktuellen GLM-Zero-Preview und dem o3-Modell von OpenAI, aber eine Reise von tausend Meilen beginnt mit einem einzigen Schritt. Zhipu sagte, dass die iterative Reinforcement-Learning-Technologie auch in Zukunft weiter optimiert werden wird.
Tatsächlich setzen Hersteller wie Zhipu voll und ganz auf Inferenzmodelle, was zeigt, dass die GPT-Ära in die Inferenzära übergeht.
Im Gegensatz zu früheren GPT-basierten Modellen ist das Inferenzmodell nicht darauf trainiert, menschliche Gedanken vorherzusagen, sondern durch Training des „Denkens“ einen eigenen Denkrahmen aufzubauen und durch einen strengen Argumentationsprozess Schlussfolgerungen zu ziehen.
Der Beginn des Zeitalters des Denkens deutet darauf hin, dass die KI beginnen könnte, von der „Nachahmung“ zum „Denken“ überzugehen.
Auch die von Zhipu eingeführte GLM-Zero-Preview spiegelt diesen Trend wider.
Wenn Sie beobachten, wie es Fragen beantwortet, werden Sie feststellen, dass es keine direkten Antworten gibt, sondern einen vollständigen Denkprozess zeigt – Hypothesen vorschlagen, Bedingungen analysieren und Schlussfolgerungen ableiten. Jeder Schritt des tiefgreifenden Denkens ist deutlich sichtbar.
Wenn in Zukunft weitere Modelle wie o1 und GLM-Zero-Preview auftauchen, macht die KI einen großen Schritt in Richtung des gleichen kognitiven Niveaus wie der Mensch. Mit anderen Worten: Wir erleben möglicherweise auch einen wichtigen historischen Wendepunkt.
Zhipus Vision ist es, „Maschinen dazu zu bringen, wie Menschen zu denken“. Wenn Maschinen beginnen, wirklich zu „denken“, wird das menschliche Verständnis von Intelligenz eine neue Ebene erreichen.
# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.
Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo