ChatGPT Advanced Voice-Modus: Veröffentlichungsdatum, Kompatibilität und mehr

August 6, 2024 Eskere Guru

Der erweiterte Sprachmodus ist eine neue Funktion für ChatGPT , die es Benutzern ermöglicht, in Echtzeit menschenähnliche Gespräche mit dem KI-Chatbot zu führen, ohne dass ein textbasiertes Eingabeaufforderungsfenster oder Hin- und Her-Audio erforderlich ist. Es wurde Ende Juli für ausgewählte Plus-Abonnenten veröffentlicht, nachdem es erstmals auf der Spring Update-Veranstaltung von OpenAI vorgeführt wurde.

Nach Angaben des Unternehmens bietet die Funktion „natürlichere Gespräche in Echtzeit, ermöglicht es Ihnen, jederzeit zu unterbrechen und Ihre Emotionen zu spüren und darauf zu reagieren.“ „Es kann sogar Atempausen einlegen und menschliches Lachen während eines Gesprächs simulieren. Das Beste daran ist, dass der Zugang bald verfügbar ist, falls Sie ihn noch nicht haben.

Wann erhalte ich den erweiterten Modus?

Letzte Woche hat OpenAI endlich seine mit Spannung erwartete Advanced Voice-Funktion für einige ausgewählte ChatGPT-Plus-Abonnenten veröffentlicht. Es gibt also bereits einige Leute, die es nutzen. Wir wissen jedoch nicht, wie groß dieser erste Rollout ist oder wie schnell OpenAI neue Mitglieder einlädt.

Das Unternehmen verspricht, es in den kommenden Wochen für mehr Benutzer und bis zum Herbst für alle Plus-Abonnenten bereitzustellen, obwohl viele Benutzer weiterhin ungeduldig darauf warten, es selbst auszuprobieren. Die einfache Antwort lautet also, dass Sie irgendwann bis zum Herbst Zugriff darauf erhalten, sofern es nicht zu weiteren Verzögerungen kommt. „Herbst“ kann vage sein, aber wenn wir nicht bis Dezember eine vollständige Einführung für alle Benutzer sehen, würde das eine Verzögerung bedeuten.

In jedem Fall wissen Sie, dass Sie Zugriff haben, wenn Sie eine E-Mail mit der Einladung erhalten, es auszuprobieren. Sie sehen außerdem eine Benachrichtigung, wenn Sie die ChatGPT-App öffnen.

Was benötige ich, um den erweiterten Sprachmodus auf meinem Telefon auszuführen?

die erweiterte Sprachwarnung in der ChatGPT-App — OpenAI

Zusätzlich zu einem Plus-Abonnement benötigen Benutzer ein Android-Handy mit App-Version 1.2024.206 oder höher oder ein iPhone mit iOS 16.4 oder höher und App-Version 1.2024.206 oder höher. Leider reicht es nicht aus, nur über die richtige Ausrüstung zu verfügen, um einen Platz in der Alpha-Release-Phase zu garantieren. Darüber hinaus hat OpenAI keine Details darüber veröffentlicht, wie oder warum es die von ihm ausgewählten Benutzer auswählt.

Wenn Sie bei der Alpha-Release-Lotterie gewinnen und ausgewählt werden, sendet Ihnen OpenAI eine E-Mail darüber. Außerdem wird in der unteren rechten Ecke der mobilen ChatGPT-App ein Tooltip angezeigt, mit dem Sie die neue Funktion auswählen können.

Wird OpenAI meine Gespräche nutzen, um sein Modell zu trainieren?

Natürlich. Während der gesamten Alpha-Release-Phase plant OpenAI, Audio aus Gesprächen mit dem erweiterten Sprachmodus zu nutzen , um seine Modelle zu trainieren, vorausgesetzt, Sie haben die Datenfreigabeoption der App noch nicht deaktiviert.

Das ist eigentlich ganz einfach . Gehen Sie in Ihrer mobilen App zur Registerkarte „Datenkontrollen“ im Menü „Einstellungen“ und deaktivieren Sie die Option „Stimme für alle verbessern“ .

Wie oft und wie oft kann ich den erweiterten Sprachmodus nutzen?

Laut OpenAI unterliegen sowohl die Ein- als auch die Ausgänge für Advanced Voice täglichen Nutzungsbeschränkungen. Es gibt jedoch keine genauen Angaben zur genauen Dauer dieser Beschränkungen und „genaue Beschränkungen können sich ändern“. Allerdings hat der Benutzer Himels Tech bereits ein Video gepostet, in dem er sich fast zehn Minuten lang mit der KI unterhält.

Die KI benachrichtigt Benutzer, wenn sie noch drei Minuten Zeit zum Chatten haben, bevor sie das Gespräch beendet und den Benutzer zurück zur Standard-Sprachschnittstelle leitet.

Was kann ich mit dem erweiterten Sprachmodus tun und was nicht?

Khan!!!!!! pic.twitter.com/xQ8NdEojSX
– Ethan Sutin (@EthanSutin) 30. Juli 2024

Der erweiterte Sprachmodus ist im Kern einfach eine neue Möglichkeit, mit demselben großen GPT-4o-Sprachmodell zu interagieren, das Menschen bereits für ihre textbasierten Abfragen verwenden. Kurz gesagt: Fast alles, was Sie mit ChatGPT tun können, können Sie auch mit Advanced Voice machen, allerdings mit lustigen Stimmen. Von Beatboxing über Storytelling bis hin zu wirklich sehr, sehr schnellem Zählen – die ersten Benutzer testen die neue Funktion bereits auf Herz und Nieren .

Es gibt jedoch Sicherheitsvorkehrungen und Funktionseinschränkungen für die Anforderungen, die Benutzer an den neuen Modus stellen können. Zum einen können Benutzer Advanced Voice nicht verwenden, um neue Erinnerungen zu erstellen, noch können sie benutzerdefinierte Anweisungen verwenden oder damit auf GPTs zugreifen. Und während sich die KI an frühere Advanced Voice-Gespräche erinnert und Details dieser Gespräche abrufen kann, kann sie noch nicht auf frühere Chats zugreifen, die über die Textaufforderung oder den Standard-Sprachmodus geführt wurden.

Darüber hinaus singt Advanced Voice nicht, egal wie Sie es wünschen. Um die Rechte der Urheber zu respektieren, haben wir laut Angaben des Unternehmens mehrere Abhilfemaßnahmen eingeführt, darunter neue Filter, um zu verhindern, dass der erweiterte Sprachmodus mit musikalischen Inhalten, einschließlich Gesang, reagiert.“