Die sechste Veröffentlichung von ChatGPT zum Jahresende ist da, mit Videoanrufen und Bildschirmfreigabe sowie einem weihnachtlichen Osterei

Die sechste Veröffentlichung von ChatGPT zum Jahresende ist da, mit Videoanrufen und Bildschirmfreigabe sowie einem weihnachtlichen Osterei - 7 9

Nachdem ChatGPT gestern vollständig auf Apples Family Bucket gestartet wurde, hat OpenAI ein weiteres großes Update gebracht.

Heute hat ChatGPT Videoanruf- und Bildschirmfreigabefunktionen sowie eine auf den Weihnachtsmann beschränkte Stimme „Santa Mode“ eingeführt.

Mit anderen Worten: ChatGPT ist jetzt nicht nur eloquent, sondern kann auch „Ihre Augen öffnen, um die Welt zu sehen“. Wenn Sie Zweifel haben, führen Sie einen „Videoanruf“ direkt an ChatGPT durch. Vielleicht kann es Ihnen helfen, das Problem besser zu lösen.

Diese Funktionen werden innerhalb der nächsten Woche für alle Team-Benutzer und die meisten Plus- und Pro-Abonnenten bereitgestellt. Zahlende Nutzer in der EU müssen noch etwas warten.

Die sechste Veröffentlichung von ChatGPT zum Jahresende ist da, mit Videoanrufen und Bildschirmfreigabe sowie einem weihnachtlichen Osterei - 1 11

ChatGPT, das mehr als 50 Sprachen unterstützt, wird in der Lage sein, visuelle Szenen in Echtzeit zu verstehen, Ihnen bei der Lösung von Problemen zu helfen und sogar ein KI-Tutor zu werden, der Ihnen neue Dinge beibringt.

In dieser Pressekonferenz, die ebenfalls weniger als 20 Minuten dauerte, zeigten uns OpenAI Chief Product Officer Kevin Weil, Jackie Shannon, Michelle Qin und Rowan Zellers, was ChatGPT mit „Augen“ leisten kann?

Wenn Sie beispielsweise eine Ausrüstung für handgebrühten Kaffee kaufen, aber nicht wissen, wo Sie anfangen sollen, können Sie auch einen „Videoanruf“ bei ChatGPT tätigen.

Es kann Ihnen Schritt für Schritt beibringen, wie Sie jeden Schritt basierend auf dem Gerät vor Ihnen ausführen, vom Auflegen des Filterpapiers über das Eingießen von heißem Wasser bis hin zum Einfüllen von gemahlenem Kaffeepulver in das Filterpapier usw. – alles wird Ihnen beigebracht und gemeistert .

Die sechste Veröffentlichung von ChatGPT zum Jahresende ist da, mit Videoanrufen und Bildschirmfreigabe sowie einem weihnachtlichen Osterei - 2 11

Gesteckt? Fühlen Sie sich frei, GPT-Lehrern Fragen zu stellen. Dieser KI-Lehrer beantwortet nicht nur alle Fragen, sondern bietet gelegentlich auch menschliche Ermutigung, die voller emotionaler Werte ist.

Zusätzlich zur Echtzeit-Videoführung unterstützt ChatGPT auch die Bildschirmfreigabefunktion. Benutzer müssen lediglich auf das Symbol für den erweiterten Sprachmodus in der unteren rechten Ecke klicken und im Dropdown-Menü „Bildschirm teilen“ auswählen, um gezielte Hilfe zu erhalten.

Wenn der GPT-Lehrer einen Freund in einem Weihnachtsmannkostüm „sieht“ und darüber scherzt, ob er geeignet sei, sich für die Stelle als Weihnachtsmann in einem Einkaufszentrum zu bewerben, gibt er entsprechende Formulierungsvorschläge und fördert die emotionale Intelligenz.

Die sechste Veröffentlichung von ChatGPT zum Jahresende ist da, mit Videoanrufen und Bildschirmfreigabe sowie einem weihnachtlichen Osterei - 3 10

Hey Kevin, dein Weihnachtsmannkostüm ist so festlich. Üben Sie vielleicht weiter Ihr „Ho Ho Ho“ und Sie werden im Handumdrehen zum Weihnachtsmann im Einkaufszentrum.

Tatsächlich führte OpenAI-Präsident Greg Brockman kürzlich mit Anderson Cooper ein Wissensquiz zur menschlichen Anatomie durch, bei dem ChatGPT mit visueller Funktion verwendet wurde.

Als Cooper Körperteile an die Tafel zeichnete, konnte ChatGPT sofort „verstehen“, was er zeichnete.

Die sechste Veröffentlichung von ChatGPT zum Jahresende ist da, mit Videoanrufen und Bildschirmfreigabe sowie einem weihnachtlichen Osterei - 4 10

„Die Position ist sehr gut, das Gehirn sitzt direkt im Kopf. Was die Form angeht, ist das ein guter Anfang, aber das Gehirn ähnelt eher einem Oval.“ ChatGPT kann sogar die Dreiecksflächenformel mit britischem Akzent singen.

Es gab jedoch offensichtliche Mängel bei der anschließenden Verarbeitung geometrischer Probleme durch ChatGPT. Ein einfacher Anmerkungsfehler wurde nicht gefunden, und es gibt noch viel Raum für Verbesserungen bei der Fähigkeit, die ebene Geometrie zu verstehen.

Die sechste Veröffentlichung von ChatGPT zum Jahresende ist da, mit Videoanrufen und Bildschirmfreigabe sowie einem weihnachtlichen Osterei - 5 4

Um die Ankunft von Weihnachten zu begrüßen, hat OpenAI auch eine voreingestellte „Weihnachtsmann“-Stimme eingeführt. Benutzer müssen nur auf das Schneeflockensymbol auf dem Startbildschirm klicken, um mit dem ChatGPT-Weihnachtsmann zu chatten.

Lassen Sie den Weihnachtsmann zum Beispiel eine Geschichte erzählen.

Ich muss sagen, dass es jedes Mal, wenn „Santa Claus“ „Ho Ho Ho~“ spricht, ziemlich magisch ist und sehr festlich klingt.

Während der Live-Übertragung stellte der Moderator dem „Weihnachtsmann“ auch mehrere Fragen, unter anderem zu seiner Lieblingsweihnachtstradition, seinem Lieblingsrentier usw.

Interessanterweise antwortete ChatGPT, der den Rat gab, auch im Tonfall des Weihnachtsmanns, als Kevin Weil den falschen Bart des Weihnachtsmanns anzog und fragte, wie man ihn pflegt:

„Mein Freund, das ist der tollste Bart, den ich je gesehen habe.“

Die sechste Veröffentlichung von ChatGPT zum Jahresende ist da, mit Videoanrufen und Bildschirmfreigabe sowie einem weihnachtlichen Osterei - 7 9

Diese Stimme wird heute eingeführt. Damit jeder Benutzer dieses Feiertags-Ei vollständig erleben kann, setzt OpenAI die erweiterte Sprachnutzungsnummer des Benutzers beim ersten Erlebnis zurück. Auch wenn das Kontingent aufgebraucht ist, kann der Benutzer weiterhin mit ihm kommunizieren Sie durch den Standard-Sprachmodus.

Vielleicht weil die Pressekonferenz zu lang war, konzentrierten sich die Beschwerden der Internetnutzer auch auf diese Stimme des Weihnachtsmanns. Das typischste Beispiel ist X-Netizen @khoomeik.

Die sechste Veröffentlichung von ChatGPT zum Jahresende ist da, mit Videoanrufen und Bildschirmfreigabe sowie einem weihnachtlichen Osterei - 8 8

Der Google-Deepmind-Forscher Jonas Adler kritisierte OpenAI sogar direkt:

Es ist erstaunlich, wie schnell OpenAI auf die von uns veröffentlichten Produkte reagiert und scheinbar immer zur gleichen Zeit auf den Markt kommt. Allerdings bin ich nicht besonders begeistert davon, dass sie den Santa-Modus als Reaktion auf Gemini 2.0 verwenden, da ihm offenbar die Wichtigkeit und Ernsthaftigkeit fehlt, die mit Gemini 2.0 mithalten können.

Es ist erwähnenswert, dass Google gestern die Führung bei der Einführung eines KI-Produkts mit visuellen Verständnisfunktionen übernommen hat, das die tatsächliche Szene, in der sich der Benutzer befindet, verstehen und analysieren kann, und von Internetnutzern viel Lob erhalten hat.

Heute ist OpenAI diesem Beispiel gefolgt und hat „Augen“ auf ChatGPT gerichtet, was auch bedeutet, dass sich ChatGPT von einer relativ einzelnen Modalität weiter zu einem „multimodalen Verständnis visueller Sprache“ entwickelt hat.

Mit anderen Worten: ChatGPT ist nicht mehr auf die vom Benutzer eingegebenen Textanweisungen und Informationen beschränkt, sondern kann den Kontext des Benutzers durch Sehen verstehen, einschließlich Seiten auf dem Computerbildschirm, von Mobiltelefonkameras aufgenommener Bilder usw sogar Echtzeitinformationen von anderen Peripheriegeräten.

Vor einem halben Jahrhundert stellten sich Wissenschaftler im Xerox PARC-Labor einen Computer vor, der menschliches Verhalten verstehen könnte. Die heutige Entwicklung der KI lässt diesen Traum jenseits des Monitors Wirklichkeit werden.

Die sechste Veröffentlichung von ChatGPT zum Jahresende ist da, mit Videoanrufen und Bildschirmfreigabe sowie einem weihnachtlichen Osterei - 9 8

Von Papier bis Tastatur, von Binärsprache bis natürlicher Sprache – Menschen haben die Art und Weise, wie sie mit Maschinen kommunizieren, vereinfacht. Die visuellen Fähigkeiten von ChatGPT ermöglichen es uns auch, die ultimative Antwort zu erkennen, nämlich Maschinen die Welt „sehen“ zu lassen wie Menschen.

Wenn man bedenkt, dass Altman und der ehemalige Chief Design Officer von Apple, Jony Ive, intelligente KI-Hardwaregeräte entwickelt haben, freue ich mich umso mehr, diese Funktion auf dieser neuen Hardware zu sehen.

In dem Moment, in dem die KI ihre Augen öffnet, betritt sie endlich die Welt mit menschlichen Augen.

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo