Kommt die Open-Source-Version von ChatGPT? Dieses KI-Zeichenartefakt-Team möchte, dass jeder in der Lage ist, seine eigenen großen Modelle zu erstellen

April 26, 2023 Eskere Guru

Das von Stability.ai veröffentlichte Open-Source-Modell Stable Diffusion kann derzeit als eines der am weitesten verbreiteten und wichtigsten KI-Malmodelle bezeichnet werden.

Basierend auf der Open Source Stable Diffusion hat die Entwicklergemeinschaft viele interessante Plug-Ins und Modelle erstellt, wie das Control Net-Projekt, das die Form von Grafiken steuern kann, und mehr als 1.000 verwandte Entwicklungsprojekte.

Jetzt möchte dieses KI-Unternehmen, das sich für Open Source interessiert, eine weitere große Sache machen – ein Open-Source-Large-Language-Modell ähnlich wie ChatGPT veröffentlichen.

Jeder hat einen LLM

2023 kann als Jahr des Blowout für große Sprachmodelle bezeichnet werden, denn in den vergangenen Monaten wurde fast jede Woche ein neues großes Sprachmodell veröffentlicht. Große Modelle, kleine Modelle, Textgenerierung, multimodal, Closed Source, Open Source … Jetzt ist der Frühling der großen Sprachmodelle und alle Arten von Schulen blühen auf.

Diese Aufregung gehört nicht nur Internetunternehmen wie Microsoft, Google, Baidu und Ali, sondern allen KI-bezogenen Technologieunternehmen.

Was ist im Vergleich zu den bestehenden großen Modellen das Besondere am großen Sprachmodell StableLM, das von Stability.ai veröffentlicht wurde?

Laut Stability.ai ist StableLM derzeit ein Open-Source- und transparentes Modell, das es Forschern und Entwicklern ermöglicht, den Code frei zu inspizieren, zu verwenden und zu ändern. Genau wie Stable Diffusion können Benutzer Stable LM frei konfigurieren, um ein großes Sprachmodell zu erstellen, das auf ihre Bedürfnisse zugeschnitten ist.

Das aktuelle Stable LM Alpha-Versionsmodell hat eine Parametergröße von 3 Mrd. und 7 Mrd. Zukünftig wird Stability.ai auch Modellversionen mit einer Parametergröße von 15 Mrd. und 65 Mrd. bereitstellen.

Obwohl die Modellgröße von StableLM viel kleiner ist als die 175 Milliarden Parameter des GPT-3-Modells, sagte Stability.ai, dass StableLM auf einem erweiterten Datensatz basiert, der dreimal größer ist als der The Pile-Datensatz, sowohl Codierung als auch natürliche Sprache Dialog haben eine gute Leistung.

Der Stapel-Datensatz selbst enthält bereits eine große Anzahl von Büchern, Github-Wissensdatenbanken, Webseiten, Chataufzeichnungen und andere Daten und sammelt auch Aufsätze in Medizin, Physik, Mathematik, Informatik und Philosophie, die für allgemeine große Sprache verwendet werden können Modelle und domänenübergreifende Textgenerierung Training bietet eine gute Grundlage.

Daher ist die Lücke zwischen StableLM und GPT-3 im tatsächlichen Gebrauch nicht so offensichtlich wie der Unterschied in den Papierparameterdaten.

In der Ankündigung zeigte Stability.ai die tatsächliche Leistung von StableLM bei der Bewältigung von drei verschiedenen Aufgaben, darunter das Schreiben von E-Mails und das Schreiben von Rap-Texten (Frage: Schreiben Sie einen epischen Kampftext, in dem Deep-Learning-Netzwerk und symbolische künstliche Intelligenz interagieren. Es kann nur gesagt werden that Too geeky) und Code schreiben.

Stability.ai hostet auch StableLM auf der Community-Website von HuggingFace. Freunde, die es zuerst erleben möchten, können es unter der folgenden Adresse spielen

https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat

Nach dem von uns durchgeführten Kurztest zu urteilen, ist das Chinesischniveau von StableLM nicht so gut wie das von Guo Jierui, geschweige denn im Vergleich zu Top-Studenten wie ChatGPT. Versuchen Sie also, beim Sprechen Englisch zu verwenden.

Open-Source- oder Closed-Source-Debatte

Wie viele große Open-Source-Sprachmodelle, einschließlich Alpaca von der Stanford University, bietet StableLM vielen Entwicklern die Möglichkeit, große Sprachmodelle lokal oder auf dem Server anzupassen, ohne sich Sorgen machen zu müssen, dass Ihre Daten in den Modellhintergrund gelangen.

Nachdem ChatGPT populär wurde, tauchten nach und nach Datenschutzprobleme bei KI-Modellen auf.Vor nicht allzu langer Zeit wurde Samsung auch entlarvt, dass mehrere Mitarbeiter vertrauliche Daten an ChatGPT weitergegeben haben, sodass die Halbleiterabteilung von Samsung beschloss, eigene interne KI-Tools zu entwickeln, um ähnliche Probleme zu vermeiden dass es nicht wieder passiert.

Neben den Vorteilen der hohen Transparenz erleichtert das Open-Source-Modell es Entwicklern, das Open-Source-Modell zu nutzen, um kreativere Anwendungen zu entwickeln. Sie können StableLM zum Beispiel so anpassen, dass es ein ununterbrochener Webautor oder ein leitender Programmierer oder Texter ist, der mit den Projekten des Unternehmens bestens vertraut ist, oder sogar ein Horoskopmeister auf Weibo.

Das Open-Source-Modell gibt Entwicklern mehr Raum für Fantasie, gibt Tätern aber gleichzeitig auch fortschrittlichere Mittel an die Hand.

Für diejenigen mit Hintergedanken stellt das Open-Source-Large-Language-Modell möglicherweise ein Artefakt des Telekommunikationsbetrugs dar. Sie können Menschen mit realistischen Dialogen täuschen.

Open Source wird immer von Kontroversen begleitet sein, mit denen Stability.ai schon lange gerechnet hat. Stability.ai wurde von einer Reihe von Klagen wegen angeblicher Verletzung von Künstlerrechten für Open-Source-Stable-Diffusion sowie von Kontroversen über Benutzer getroffen, die seine Tools zur Generierung von pornografischen Inhalten verwenden.

Emad Mostaque, CEO von Stability.ai, erwähnte in einem früheren Interview, dass große Modelle mehr Aufsicht erhalten müssen, anstatt von großen Unternehmen in eine kleine Blackbox gesperrt zu werden, daher ist die Offenheit großer Modelle in der Gemeinschaft ebenfalls sehr wichtig. Stability.ai besteht auf Open Source, um die Technologie mehr Menschen zugänglich zu machen und das Denken der Menschen anzuregen.

StableLM ist die jüngste Bestätigung des Versprechens von Stability.ai, dass eine Zukunft beginnen kann, in der jeder sein eigenes Sprachmodell hat.

Huang Zhijian

Schneiden Sie den Mist.

Post

#Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so bald wie möglich präsentiert.

Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo