NVIDIA blieb nicht bei der „großen Grafikkarte“ stehen, sondern veröffentlichte das Perfusion „Vincent Graph“-Modell, um neue Technologien zu erlernen
NVIDIA-Grafikkarten werden so oft verkauft, dass fast übersehen wird, dass es sich auch um einen generativen KI-Giganten handelt.
Kürzlich wurde in der neuesten Veröffentlichung von NVIDIA eine personalisierte Lerntechnologie namens „Vincent Graph“-Modell von Perfusion vorgestellt.
Laut der offiziellen Website wurde die Perfusion-Technologie gemeinsam von NVIDIA und der Universität Tel Aviv in Israel entwickelt. Die Perfusionstechnologie ermöglicht die Freiheit, personalisiertere Objekte zu erstellen, lebendigere Ergebnisse zu erzielen, eine bessere Cue-Übereinstimmung zu erzielen und weniger anfällig für die Hintergrundeigenschaften des Originalbilds zu sein.
Aaron Lefohn, NVIDIAs Vizepräsident für Grafikforschung, beschrieb die Perfusion-Technologie einmal als „eine äußerst kompakte Technologie …, die es Benutzern ermöglicht, mehrere personalisierte Elemente, wie zum Beispiel bestimmte Teddybären und Teekannen, in einem einzigen KI-generierten Bild zu kombinieren.“
Unter anderem verwendet NVIDIA einen neuartigen Mechanismus namens „Tastensperre“.
Die gängige Erklärung ist, dass der Aufmerksamkeitsmechanismus im Bilderzeugungsmodell in zwei Teile unterteilt wird: den Standortteil und den Inhaltsteil. Der Positionsteil bestimmt, welches Objekt gezeichnet werden soll, und der Inhaltsteil bestimmt den Erscheinungsbildstil des Objekts.
Der „Schlüsselmechanismus“ fixiert den Positionsteil und verhindert, dass sich das Objekt willkürlich ändert. Beispielsweise stimmt die Position eines bestimmten Teddybären mit allen modifizierten Teddybären überein. Gleichzeitig erlaubt der Inhaltsteil, das Erscheinungsbild des Objekts frei zu verändern, beispielsweise das Outfit des Teddybären aus dem Nichts zu wechseln.
Darüber hinaus kann die Perfusionstechnologie den Grad der Änderung des Objekts im Prozess des Vincent-Diagramms steuern, das eher dem Originalobjekt ähneln oder eher der Beschreibung des Benutzers entsprechen kann. Es können auch mehrere durch historische Aufzeichnungen generierte Objekte im selben Bild kombiniert werden.
Dank der fortschrittlichen Natur des „Key Lock“-Mechanismus ist die von der Perfusion-Technologie erzeugte Bildqualität nach Angaben des Beamten mit der der Stability Diffusion v1.5-Version vergleichbar.
Allerdings ist die Perfusionstechnologie stärker personalisiert und bietet die Möglichkeit, schnell zu lernen, mit neuen Konzepten umzugehen, ohne das gesamte Modell neu zu trainieren, was bei Stability Diffusion nicht verfügbar ist.
Darüber hinaus bietet die Perfusionstechnologie eine bessere Kontrolle, wodurch visuelle Qualität und semantische Kontrolle problemlos in Einklang gebracht werden können, und es können mehrere neue Konzepte kombiniert werden (z. B. dass das Modell gleichzeitig einen bestimmten Teddybären und eine bestimmte Teekanne generiert).
Im Allgemeinen bringt die Perfusionstechnologie vor allem Innovationen im Bereich des personalisierten Lernens und der Steuerung hervor, wodurch die Systemerstellung des Vincent-Diagramms einfacher anzupassen ist.
Was viele Menschen vielleicht nicht wissen, ist, dass das zurückhaltende NVIDIA tatsächlich viele Erfolge auf dem Gebiet der generativen KI erzielt und bahnbrechende Beiträge zu mehreren generativen Aufgaben wie Bild-Superauflösung und Tiefenschätzung geleistet hat.
Im Mai dieses Jahres sagte NVIDIA-Gründer Jensen Huang mutig voraus: „Die Computerindustrie durchläuft zwei gleichzeitige Veränderungen – beschleunigtes Computing und generative künstliche Intelligenz.“ Er fügte hinzu: „Während Unternehmen darum wetteifern, generative KI in jedem digitalen Zentrum im Wert von einer Billion Dollar anzuwenden.“ Die Infrastruktur wird auf beschleunigtes Computing für Produkte, Dienstleistungen und Geschäftsprozesse aufgerüstet.“
Generative KI trainiert große neuronale Netze, was eine hochkomplexe Rechenleistung erfordert. Die GPU ist vielseitiger, eignet sich besser für paralleles Computing in großem Maßstab und der Design- und Herstellungsprozess ist relativ ausgereift. Dies ist genau die Komfortzone für NVIDIA, um das „Tor des Lebens“ großer KI-Modelle zu meistern.
Bezogen auf den Marktanteil hält NVIDIA 84 % des GPU-Marktes. Laut den von TrendForce, einer Marktforschungsagentur, veröffentlichten Daten werden bei Nutzung der Rechenleistung der NVIDIA A100-Grafikkarte 30.000 NVIDIA-GPUs für den Betrieb von ChatGPT benötigt, was bedeutet, dass NVIDIA mehr als 300 Millionen US-Dollar verdienen kann .
Das einzigartige NVIDIA ist jedoch nicht nur mit dem „Goldpfannen- und Wasserverkäufer“ zufrieden, sondern hat das „angeborene Talent“ seiner eigenen Ressourcen im Bereich der Entwicklung generativer Modelltechnologien vollständig freigesetzt.
Im Jahr 2018 übernahmen NVIDIA-Forscher die Führung und schlugen das generative Konfrontationsnetzwerk StyleGAN vor, das das erste GAN-Modell ist, das hochwertige Gesichtsbilder erzeugen kann. Ein Jahr später veröffentlichte NVIDIA offiziell das erste GAN-Modell, das direkt Modelle erzeugen kann, die realistische Bilder erzeugen können .
Es gibt viele ähnliche „Neuheiten“. Heute ist die Perfusion-Technologie eines der Ergebnisse der neuesten generativen KI von NVIDIA.
Die Veröffentlichung der Perfusion-Technologie kann einerseits weiterhin die technischen Fähigkeiten von NVIDIA im Bereich der generativen KI unter Beweis stellen und die Führungsrolle und den Einfluss von NVIDIA im Bereich der generativen KI vollständig etablieren. Zukünftige Integration in NVIDIA-Produkte und -Dienste.
Es ist erwähnenswert, dass NVIDIA derzeit nur relevante Artikel auf der offiziellen Website veröffentlicht hat und in Kürze spezifische Code-Demonstrationen gestartet werden. Bis dahin werden Benutzer vielfältigere Möglichkeiten für die funktionalen Anforderungen von Vincent-Grafiken haben.
#Willkommen, dem offiziellen öffentlichen WeChat-Konto von Aifaner zu folgen: Aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich präsentiert.
Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo