Große Modelle „verkleinern“ sich zu Mobiltelefonen, der Wand-Smart bringt MiniCPM auf den Markt, eine leistungsstarke kleine Stahlkanone
Große Modelle eröffnen eine neue Ära und sie müssen KI-nativ sein.
Li Dahai, Mitbegründer und CEO von Face Wall Intelligence, sagte einmal wie oben. Seiner Ansicht nach erfordert die Ära der großen Modelle eine native KI, und die Hardware der großen Modelle, die auf der Geräteseite ausgeführt wird, ist native Hardware.
Heute Nachmittag hat Wall-facing Intelligence offiziell das 2B-Flaggschiff MiniCPM mit endseitigem, großem Modell und wandseitigem Modell veröffentlicht, und das endseitige, große Modell-Schlachtfeld wird einen neuen Spieler begrüßen.
Mit kleiner Leistung und großer Leistung ist die 2B-Performance-Kleinstahlkanone „auf der Maschine“
Wir haben zuvor berichtet, dass Mistral AI, die „europäische Version von OpenAI“, ein kurzes und kompaktes kleines Modell Mistral-7B herausgebracht hat. Obwohl es nur 7B groß ist, wurden seine Leistung und sein Energieverbrauch hoch gelobt.
MiniCPM, das nur 2 Milliarden groß ist, hat in vielen Mainstream-Bewertungslisten Mistral-7B bei den Durchschnittswerten in Chinesisch und Englisch übertroffen. MiniCPM verfügt über umfassendere Funktionen und seine Ergebnisse haben in Benchmark-Tests wie CEval, CMMLU und MMLU das Starmodell Phi-2 von Microsoft übertroffen.
In Bezug auf die durchschnittliche Punktzahl auf der englischen Liste hat MiniCPM Modelle im gleichen oder sogar größeren Maßstab deutlich übertroffen und ist sogar mit Modellen im Maßstab 13B, 30B und 40B vergleichbar. Im Bewertungssatz MT-Bench, der der menschlichen Bewertung am nächsten kommt, kann MiniCPM sogar mit Claude 2 konkurrieren und ist damit eine 2B-Leistungskanone.
Wie also erreicht wandorientierte Intelligenz das Ziel, mit kleinen Dingen Großes zu bewirken?
- Rechenleistung: effiziente Infrastruktur während des gesamten Prozesses, 10-fache Inferenzbeschleunigung, 90 % Kostenreduzierung;
- Algorithmus: Der zur Wand gerichtete Modellwindkanal ist klein und groß, und es wurden effiziente Modelltrainingskonfigurationen gefunden, um eine schnelle Ausbildung der Modellfähigkeiten zu erreichen.
- Daten: Im Sinne einer modernen Datenfabrik bildet sie eine Traktionsmodellversion mit geschlossenem Regelkreis für eine schnelle Iteration von der Datenverwaltung bis zur mehrdimensionalen Auswertung.
MiniCPM ist auch ein guter Akteur bei grundlegenden Funktionen wie der Generierung großer Modelle. Li Dahai, Mitbegründer und CEO von Face Wall Intelligence, stellte bei der Markteinführung vor, dass MiniCPM nicht nur die Höhe des Mount Huangshan und des Mount Tai genau kennt, den Unterschied berechnet, sondern sogar Code zur Eigenentwicklung und Optimierung schreiben kann.
Da der Wettbewerb um große Modelle im Jahr 2024 immer härter wird, treibt die Hinzufügung multimodaler Fähigkeiten die künstliche Intelligenz in die Ära der „Synästhesie“. MiniCPM, das als stärkste multimodale Fähigkeit seiner Klasse bekannt ist, hat auch Multi realisiert -Modalität auf Mobiltelefonen. Es kann gefährliche Lebewesen wie giftige Pilze und giftige Schlangen in freier Wildbahn genau identifizieren.
Li Dahai demonstrierte die Wirkung von MiniCPM in praktischen Anwendungen vor Ort. Wenn der Flugmodus aktiviert ist und Fragen zu Selbstrettungsmaßnahmen für den versehentlichen Verzehr giftiger Pilze oder das Verirren in der Wildnis gestellt werden, scheinen die Antworten von MiniCPM praktischer zu sein als leere „Klischees“. Wenn Sie in freier Wildbahn auf schlechte Signalbedingungen stoßen, können Ihnen diese Vorschläge von MiniCPM offline eine große Hilfe sein.
Im technologischen Wettbewerb mit steigender Skalierung stellen die Kosten die unsichtbare Wettbewerbsfähigkeit großer Modelle dar. Zusätzlich zu seiner leistungsstarken Leistung betragen die Inferenzkosten von MiniCPM nur 1 % von Mistral-Medium.
Als groß angelegtes terminalseitiges Modell hat MiniCPM erfolgreich gängige internationale Mobiltelefonmarken und Terminal-CPU-Chips durchlaufen. Sogar alte Mobiltelefone können normal laufen. Aus Sicht des Durchsatzes läuft der Betrieb jedoch immer noch und ist tatsächlich Die Leistung muss möglicherweise verbessert werden.
Basierend auf der Anhäufung wandbezogener Intelligenz im Bereich großer Modelle kündigte Li Dahai auf der Pressekonferenz auch offiziell an, dass er Open Source weiter vorantreiben und „große Modelle in Tausende von Haushalten fliegen lassen“ werde. Die Open-Source-Adresse (einschließlich technischer Bericht) lautet wie folgt:
MiniCPM GitHub: https://github.com/OpenBMB/MiniCPM
OmniLMM GitHub: https://github.com/OpenBMB/OmniLMM
Am Ende der Pressekonferenz demonstrierte Li Dahai auch die multimodalen Echtzeit-Interaktionsfähigkeiten des mniLMM-12B-Modells. Ähnlich wie bei der vorherigen Idee des großen Google Gemini-Modells zur Demonstration multimodaler Fähigkeiten baten sie MiniCPM auch, ein „Ratespiel“ mit Stein, Papier und Schere zu spielen. Die Ergebnisse zeigten, dass die Glätte, Genauigkeit und Verzögerung von Die Antworten lagen alle im akzeptablen Bereich.
Auch die Fähigkeit zum logischen Denken ist ein wichtiges Highlight. Nach dem Hochladen eines Bildes ohne Textbeschreibung kann es anhand kleiner Details wie Kleidung, Sonnenbrille und Führungsstöcken genau auf die Bedeutung des Bildes schließen und so seine umfassende Fähigkeit zum „Sehen und Denken“ voll unter Beweis stellen.
Internet der Agenten
„Wenn Agentenfähigkeiten in End-Side-Modellen genutzt werden, können sie bestimmte Szenarien besser bedienen und mehr Wert schaffen. Ich denke, diese beiden Richtungen können sich gegenseitig unterstützen und einige wunderbare chemische Reaktionen hervorrufen.“
Zeng Guoyang, CTO von Wall-Facing Intelligence, sprach über die Beziehung zwischen dem terminalseitigen Großmodell und dem Agenten. Auf dieser Pressekonferenz bekräftigte Li Dahai auch die Dual-Engine-Strategie von großem Modell + Agent. Seiner Ansicht nach dient die Veröffentlichung von MiniCPM immer noch der Dual-Engine-Strategie.
Wenn große Modelle in Landungsszenarien integriert werden sollen, wird AI Agent tatsächlich zu einem Schlüsselansatz. Wall-Facing Intelligence ist eines der ersten Unternehmen, das das Konzept des Agenten vorgeschlagen hat. Beamte des Wall-Facing Intelligence haben sogar behauptet, dass die zukünftige Welt eine Welt von Agenten sein wird und dass alles ein Agent sein wird.
Stellen Sie sich vor, Sie brauchen nur die Zutaten in den Reiskocher zu geben, einen Moment zu warten, und schon kommt ein dampfender Topf mit Brei heraus. Während dieses Vorgangs nutzt der Reiskocher die integrierte Agent-Technologie um Temperatur und Hitze automatisch anzupassen. Das Garen kann ohne manuelles Eingreifen abgeschlossen werden.
Auf der letztjährigen Yunqi-Konferenz sagte Li Dahai: „Großes Modell + Agent werden eine neue Runde großer technologischer Veränderungen mit sich bringen.“
Damals verglich er große Modelle mit dem Motor eines Autos, der das Auto mit Strom versorgt. Um ein komplettes Auto zu bauen, braucht man jedoch auch Lenkung, Fahrwerk und alles andere.
Ebenso glaubt er, dass auf der Grundlage der Engine großer Modelle eine Reihe übergeordneter Technologien wie Speicherfähigkeiten und die Fähigkeit zur Verwendung von Werkzeugen überlagert werden müssen, um breitere Anwendungsaussichten und Vorstellungskraft zu erweitern. AI Agent ist die Einheit, die über diese technischen Fähigkeiten verfügt.
Seit seiner Gründung hat Wallface Intelligence damit begonnen, die technische Route und Implementierungsrichtung von „Großmodell + Agent“ zu planen und nacheinander die „Troika“ von KI-Agenten auf den Markt zu bringen – XAgent, AgentVerse und ChatDev.
Diese drei Produkte basieren alle auf großen Modellen und stellen die neuesten Innovationen und Anwendungsergebnisse von AI Agent dar. Sie zielen darauf ab, große Modelle mit der tatsächlichen Umgebung zu kombinieren. Unter ihnen ist XAgent ein großes modellgesteuertes KI-Agent-Anwendungsframework AgentVerse ist eine universelle Plattform für Agenten, während ChatDev ein kollaboratives Entwicklungsframework für mehrere Agenten ist.
Spezifisch für die Implementierungsrichtung von ToB wird erwartet, dass AI Agent mehrere Rollen innerhalb des Unternehmens übernimmt und die Betriebsprozesse und die Organisationsstruktur des Unternehmens neu gestaltet. Diese KI-Agenten können ähnlich wie herkömmliche Unternehmensmitarbeiter verschiedene Aufgaben ausführen und so die Kosten senken und die Effizienz steigern.
Für Verbraucheranwendungen (ToC) kann AI Agent in Form eines intelligenten Assistenten auftreten, um Benutzern personalisierte und komfortable Dienste bereitzustellen. Diese intelligenten Assistenten können Benutzerbedürfnisse verstehen und vorhersagen sowie in Echtzeit Hilfe und Vorschläge bereitstellen und so das Benutzererlebnis und die Lebensqualität verbessern.
Wie also sollte die Zukunft von AI Agent aussehen?
Die Vision und das Konzept von Wall-Facing Intelligence ist das „Internet der Agenten“, das es KI-Agenten ermöglichen soll, alles auf der Welt zu verbinden und die Transformation vom „Internet of Everything“ zur „Intelligence of Everything“ zu realisieren.
Dieses Konzept wurde von Liu Zhiyuan, einem ständigen außerordentlichen Professor am Institut für Informatik der Tsinghua-Universität und Gründer von Wall-Facing Intelligence, vorgeschlagen. Er sagte auch selbstbewusst in einer öffentlichen Rede:
Mit Blick auf die Zukunft können mehr Menschen, Geräte und Objekte über große modellgesteuerte intelligente Plattformen verbunden werden, wodurch das Internet of Everything zum intelligenten Internet of Everything wird und eine neue Ära des intelligenten Internets der Dinge (LoA) von Mensch und Computer beginnt Interaktion. Wir werden die zweite Entstehung der künstlichen Intelligenz einläuten.
In der Vorstellung dieses Top-Experten, der seit Jahrzehnten im Computerbereich arbeitet, besteht die zweite Entstehung künstlicher Intelligenz darin, einzelne Agenten mit ihren eigenen Stärken zu verknüpfen, um komplexe Gruppenintelligenz zu bilden und so ein leistungsfähigeres Emergenzverhalten zu zeigen.
In einem aktuellen Online-Interview zwischen Li Dahai und Kevin Kelly, dem Autor von „Out of Control“, äußerte Kevin Kelly ebenfalls ähnliche Ansichten. Er glaubt, dass die Zusammenarbeit zwischen KIs ein enormes Potenzial hat und dass in Zukunft ein Ökosystem aus Hunderten oder sogar Tausenden verschiedener KIs entstehen wird, das erstaunliche Kräfte freisetzt.
Tatsächlich bezeichnet Schwarmintelligenz als ein in Natur und Gesellschaft weit verbreitetes Phänomen die Fähigkeit einer aus vielen einfachen Individuen bestehenden Gruppe, ein hohes Maß an intelligentem Verhalten an den Tag zu legen. In der Natur manifestiert sich dieses intelligente Verhalten in verschiedenen Formen, beispielsweise im kollektiven Handeln von Ameisenkolonien, Bienenschwärmen und Fischschwärmen.
Wenn Ameisen nach Nahrungsquellen suchen oder zu ihren Nestern zurückkehren, setzen sie Pheromone frei, um ihre Artgenossen auf den kürzesten Weg zu führen. Bei der Wanderung bilden Fischschwärme ein schützendes Schwimmmuster, indem sie ihre Positionen und Aktionen eng koordinieren und es der gesamten Gruppe ermöglichen, Raubtieren effektiv auszuweichen und Energie zu sparen.
Li Dahai hat sich auch die berühmten Sprüche aus „Das Drei-Körper-Problem“ ausgeliehen, um eine Neujahrsflagge zu hissen – um AGI „schneller“ zu machen, was die Vision der Wall-facing Intelligence Company widerspiegelt, „alle Dinge zu intelligenz“.
Das Schöne am Leben ist, von etwas besessen zu sein. Das Leben ist zu kurz, tue keine leichtfertigen Dinge.
# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich zur Verfügung gestellt.
Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo