Amazon stellt seine neue Familie der Nova-Basismodelle vor
Andy Jassy, CEO von Amazon, betrat am Dienstag die Bühne der re:Invent-Konferenz des Unternehmens, um sechs neue Modelle zur Text-, Bild- und Videogenerierung vorzustellen, die das Unternehmen Amazon Nova nennt.
Zu dieser neuen Familie multimodaler generativer KIs gehören Nova Micro, ein Nur-Text-Modell, das für kostengünstige Antworten mit geringer Latenz entwickelt wurde; Nova Lite, ein kostengünstiges multimodales Modell zur Verarbeitung von Bild-, Video- und Texteingaben; und Nova Pro, sein multimodales Allzweckmodell, das „Genauigkeit, Geschwindigkeit und Kosten für ein breites Aufgabenspektrum“ kombiniert, heißt es in der Ankündigung des Unternehmens . Nova Premier ist Amazons „leistungsfähigstes … multimodales Modell für komplexe Argumentationsaufgaben“, während Nova Canvas eine spezielle Text-zu-Bild-Engine ist und Nova Reel speziell für die Generierung von Videos entwickelt wurde.
Die textbasierten Modelle wurden für 15 verschiedene Sprachen optimiert. Micro bietet ein Kontextfenster mit 128.000 Token, während sowohl Lite als auch Pro bis zu 300.000 Token (ca. 225.000 Wörter oder 30 Minuten Video) verarbeiten können. Das Unternehmen plant, die Kontextfenster seiner größeren Modelle bis Anfang nächsten Jahres auf bis zu 2 Millionen Token zu erweitern.
Mit Canvas können Benutzer Bilder mithilfe von Eingabeaufforderungen in natürlicher Sprache erstellen und bearbeiten. Reels, die mit Gen-3 Alpha , Kling und Dall-E 3 konkurrieren werden, können Clips mit einer Länge von bis zu sechs Sekunden sowohl aus Textansagen als auch aus Referenzbildern generieren. Der Videogenerator bietet auch Kamerabewegungssteuerung einschließlich Schwenken und Zoomen.
„Wir haben weiter an unseren eigenen Grenzmodellen gearbeitet“, sagte Jassy der versammelten Menge, „und diese Grenzmodelle haben in den letzten vier bis fünf Monaten enorme Fortschritte gemacht.“ Und wir dachten, wenn wir einen Wert daraus ziehen würden, würden Sie wahrscheinlich auch einen Wert daraus ziehen.“
Jassy sagt auch, dass diese Modelle sowohl zu den kostengünstigsten als auch zu den schnellsten ihrer Klasse gehören, obwohl das Unternehmen noch keine Benchmark-Daten veröffentlicht hat, die diese Behauptungen stützen. „Wir haben diese Modelle für die Zusammenarbeit mit proprietären Systemen und APIs optimiert, sodass Sie mit diesen Modellen viel einfacher mehrere orchestrierte automatische Schritte – Agentenverhalten – durchführen können“, sagte er. „Deshalb finde ich diese sehr überzeugend.“
Die Modelle Micro, Lite und Pro (sowie Canvas und Reels) sind derzeit alle für AWS-Kunden verfügbar. Die Premiere soll im ersten Quartal 2025 erfolgen.