Warum ist dies das größte iOS-Update dieses Jahr?
Obwohl sich die Wahrnehmung der Verbraucher zu KI-Mobiltelefonen und AIPCs größtenteils noch im Konzeptstadium befindet, werden auch die gesamte Branche und die Verbraucher große Erwartungen haben, wenn Apple eine öffentlichkeitswirksame Ankündigung seines Beitritts macht.
Genau wie der Vision Pro, der letztes Jahr auf der WWDC vorgestellt wurde, freut sich die Head-Mounted-Display-Branche darauf, dass Apple eine Runde Markterziehung abschließt und eine neue Situation eröffnet. Bei KI-Geräten, die immer noch umstritten sind, kann die positive Bedeutung eines Riesenbeitritts die Bedrohung durch Konkurrenz bei weitem überwiegen.
Bloomberg-Reporter Mark Gurman brachte frühzeitig die Nachricht, dass Apple intensiv an der Entwicklung einer Reihe von KI-Funktionen arbeitet und plant, diese in das Betriebssystem iOS 18 zu integrieren.
Gemessen daran, wie verschwiegen Apple in der Vergangenheit war, werden Apples konkrete KI-Problemlösungsideen oft erst im letzten Moment der Pressekonferenz finalisiert, auch wenn es Gerüchte von außen gibt davon ab, einige Hinweise aus den jüngsten Entwicklungen von Apple zu erhalten.
Kürzlich zeigte Apple in einem großen Modellpapier der Außenwelt die neuesten Fortschritte von Apple im Bereich KI.
Durch den Einsatz der ReALM-Technologie kann Siri nun den Inhalt auf dem Bildschirm des Benutzers in Echtzeit verstehen und identifizieren, ohne auf sensible Screenshots oder Bilddaten angewiesen zu sein. Gleichzeitig wird die Intelligenz verbessert und gleichzeitig die Privatsphäre und Sicherheit des Benutzers vollständig geschützt.
Stellen Sie sich ein Szenario vor, in dem Siri beim Erteilen des Befehls „Öffne die erste APP auf meinem Bildschirm“ mithilfe der ReALM-Technologie die Elemente und das Layout auf dem Bildschirm in Textinformationen umwandeln und den Befehl des Benutzers entsprechend ausführen kann.
Kurz gesagt, Siri auf Ihrem Telefon wird intelligenter und versteht Sie besser.
Siris 13-jähriger Weg zur „Klugheit“
Siri ist seit dreizehn Jahren auf dem Weg, „schlau“ zu werden.
Vor dreizehn Jahren waren Sie erstaunt über die Frische von Siri, mit der Sie Wecker stellen und das Wetter für den Tag überprüfen konnten, als würde Ihnen eine neue Ära der Mensch-Computer-Interaktion bevorstehen.
Dreizehn Jahre später verwenden Sie es immer noch, um den Wecker zu stellen und das Wetter für den Tag zu überprüfen, aber die Enttäuschung hat die ursprüngliche Neuheit ersetzt, genau wie Eltern, die hoffen, dass ihre Kinder Erfolg haben, aber es hassen, dass Eisen nicht ausreicht.
2024: KI ersetzt Programmierer/Künstler etc.
Siri im Jahr 2024: Entschuldigung, ich habe dich nicht verstanden
Selbst Siris treuester Fan, Steve Jobs selbst, hätte nie erwartet, dass Siri sein halbes Leben lang weg sein und als Teenager zurückkehren würde. Was viele vielleicht nicht wissen, ist, dass Siri genau wie iTunes tatsächlich von Apple mit echtem Geld gekauft wurde.
Anfang 2010 rief Jobs Dag Kittlaus an, den „Vater von Siri“. Nach einem dreistündigen Treffen wurde Siri mit Jobs‘ Bemühungen im April desselben Jahres von Apple eingestellt. Seitdem ist Siri über Apples „Family Bucket“ in Tausende von Haushalten eingedrungen und hat sich zu einem unauslöschlichen und ikonischen Symbol in der Geschichte der Marke Apple entwickelt.
So wie der beliebte „Fruit Ninja“ die Menschen nach und nach mit dem Touchscreen-Erlebnis vertraut machte, führte die Popularität von Siri nicht nur zu einer neuen Art der Interaktion, sondern auch zu einer Veränderung der Lebensgewohnheiten. Die Menschen gewöhnen sich daran, natürliche Sprache für die Kommunikation mit Maschinen zu verwenden und Sprachbefehle zu nutzen, um alltägliche Aufgaben zu vereinfachen.
Die Sprachsteuerung ist lediglich eine Veränderung der Interaktionsform. Im Jahr 2011 hatte Apple große Ambitionen und Erwartungen an die Einführung von Siri.
Apple sieht Siri nicht nur als einfachen Sprachassistenten, sondern als intelligenten Partner, der Benutzerbedürfnisse verstehen und Hilfeprobleme lösen kann. Wie Apple-Marketingchef Phil Schiller es bei der Einführung von Siri beschrieb:
Ein intelligenter Assistent, der Sie durch Sprachbefehle bei der Erledigung von Aufgaben unterstützen kann.
Dies spiegelte sich bereits in der Originalversion von Siri wider, bevor diese von Apple übernommen wurde.
Nach der Vorstellung von Dag Kittlaus und anderen sollte Siri ein Assistent sein, der Informationen schnell und präzise abrufen kann, und ein intelligenter Assistent, der verschiedene komplexe Aufgaben kompetent bewältigen kann.
Die frühe Version von Siri konnte eine Verbindung zu 42 Netzwerkdiensten herstellen und deckte Bereiche ab, die von Restaurantbewertungen auf Yelp über Filmkritiken auf Rotten Tomatoes bis hin zu mathematischen Berechnungen auf Wolfram Alpha reichten.
Durch die Integration von Informationen dieser Websites kann Siri den Benutzern ein One-Stop-Service-Erlebnis in Form von Text bieten.
Norman Winarsky, Mitbegründer von Siri, betonte einmal, dass Siris ursprüngliches Ziel darin bestand, die Absichten des Benutzers zu verstehen, genaue Antworten zu geben und diese Aufgaben im Namen des Benutzers auszuführen. Während der Ausführung sammelt Siri Daten, um in Zukunft präzisere Dienste bereitzustellen.
Was wir brauchen, ist keine Suchmaschine, sondern eine Suchmaschine. Das ist unser kreativer Durchbruch.
Dieses Produkt kann wie eine echte Person mit Ihnen interagieren. Wir nennen dies „Anthropomorphismus“, wie ein freundlicher und aufmerksamer Assistent.
Nach der Übernahme durch Apple hat Siri die Entwicklung intelligenter Assistenten tatsächlich stetig vorangetrieben. Es kann nicht nur Benutzeranfragen reibungslos beantworten, sondern auch eine Reihe täglicher Aufgaben durch Sprachinteraktion ausführen, z. B. Wecker stellen, Nachrichten senden, das Wetter überprüfen usw.
In der fünften Staffel von „The Big Bang Theory“ verliebte sich Raj, ein in Indien geborener Wissenschaftler, auf den ersten Blick in Siri auf dem iPhone 4S. Diese einseitige „Liebe“ basiert auch auf der grundlegenden Sprachverständnisfähigkeit, die Siri und Raj in einfacher Kommunikation demonstriert haben.
Als Siri herauskam, wurde es daher auch von ausländischen Technologiemedien mit überwältigender Mehrheit gelobt.
The Verge betonte einmal, dass das Beste an Siri seine Funktionsweise ist – zumindest in vielen Szenarien übertrifft sein Niveau die Erwartungen der Benutzer. CNN verglich Siri anschaulich mit „dem intelligenten Assistenten unserer Träume“, der immer verfügbar ist, wenn man ihn ruft. Auch die New York Times lobte es und wies darauf hin, dass Siri die Definition von Mobiltelefonen durch Zeiteinsparungen und die Reduzierung redundanter Vorgänge grundlegend verändert habe.
Das Tempo der Geschichte schreitet nicht immer in einem vorgegebenen Rhythmus voran. Manchmal finden wir den Rhythmus des Fortschritts nicht, selbst wenn wir uns immer wieder drehen.
So wie Sie Siri bitten, nach Osten zu gehen, es aber gelegentlich nach Westen geht, stellt die Neuheit für Siri die „Freude auf den ersten Blick“ des Benutzers dar, aber Stagnation führt auch dazu, dass der Benutzer nach langer Zeit „langweilig“ wird.
Am Tag nach dem Debüt von Apples Siri verstarb Steve Jobs leider an Krebs, was einen Schatten auf Siris Entwicklung warf, der schwer zu beseitigen war. Ein ehemaliger Apple-Mitarbeiter musste in einem Interview mit The Information seufzen:
Jobs starb am Tag nach der Einführung von Siri und Apple verlor seinen Weg nach vorne.
Darüber hinaus hatten auch häufige Wechsel im Führungsteam von Apple und interne Fraktionskämpfe innerhalb des Unternehmens erhebliche Auswirkungen auf die reibungslose Entwicklung von Siri. In früheren Artikeln hat APPSO auch die Gründe analysiert, warum Siri „dumm“ geworden ist. (https://mp.weixin.qq.com/s/7oDXkASTZgGIjKJaFWPLkQ)
Unter dem Angriff interner und externer Faktoren hat sich das Entwicklungstempo von Siri, das bei seinem Debüt seinen Höhepunkt erreichte, allmählich verlangsamt und es hat sich in der Vergangenheit allmählich vom „akademischen Meister“ zu einem „dummen Schüler“ entwickelt.
Der Endpunkt von Siris „Klugheit“ ist auch der Ausgangspunkt
Ich habe gehört, dass Apples Siri „rückläufig“ ist? Und so eine gute Sache!
Die schlagartige Popularität von ChatGPT hat der Welt die herausragende Leistung großer Sprachmodelle (LLM) in den Bereichen Sprachverständnis, Generierung, Interaktion und Argumentation gezeigt. Sie gab Siri auch die Möglichkeit, zum Ausgangspunkt zurückzukehren – eine Intelligenz zu werden, die das kann Der Assistent versteht die natürliche Sprache wirklich und reagiert darauf.
Vor nicht allzu langer Zeit teilte auch Kittlaus, der „Vater von Siri“, seine Vision für die KI Siri auf X mit und listete eine Reihe von Anwendungsszenarien auf.
Siri, kannst du mich benachrichtigen, wenn Chris Malinchak einen neuen Song veröffentlicht, und Spotify bitten, ihn zu meinem Chill Beats-Ordner hinzuzufügen?
Siri, bitte wecke mich dienstags und donnerstags um 7 Uhr und an anderen Wochentagen um 8 Uhr. Stören Sie mich am Wochenende nicht, es sei denn, Sie sehen einen Morgentermin in meinem Kalender. Wenn Sie einen Morgentermin haben, wecken Sie mich bitte umgehend.
Im Jahr 2024 wird Apple seine Muskeln im Bereich der generativen KI spielen lassen, und Siri könnte der wichtigste Interaktionsträger sein.
Bei der letzten Finanzberichtssitzung verriet Apple-CEO Cook in ungewöhnlicher Weise der Außenwelt, dass das Unternehmen im Jahr 2024 „den Grundstein für generative KI legen“ werde, und betonte sogar mehrfach, dass Apple noch in diesem Jahr Pläne für generative KI bekannt geben werde . Wichtige Nachrichten.
Im Vergleich zu der Nachricht, dass Apples Traum, ein Auto zu bauen, nach zehn Jahren geplatzt ist, ist es noch auffälliger, dass einige der Apple-Mitarbeiter, die ursprünglich für das Autobauprojekt verantwortlich waren, in die Forschung und Entwicklung generativer Technologien versetzt werden KI-Projekte.
Auch Apple investiert stark in generative KI. Als wertvollstes Unternehmen der Welt konzentriert sich Apple mit seinen tiefen Taschen auf den Kauf und Verkauf und beschleunigt die Anhäufung von Technologie und das Innovationstempo durch Akquisitionen.
Laut dem neuesten Bericht des Marktforschungsunternehmens Stocklytics hat Apple im Jahr 2023 32 KI-Unternehmen übernommen und belegt damit den ersten Platz in der Akquisitionsliste der großen Technologieunternehmen.
Wenn wir uns gleichzeitig die Forschungsarbeiten des Apple-Teams für maschinelles Lernen im vergangenen Jahr ansehen, können wir deutlich erkennen, dass Apple großen Wert auf die Machbarkeit der Ausführung großer Modelle auf Endgeräten legt.
Im Januar dieses Jahres erörterte das Team für maschinelles Lernen von Apple in einem neu veröffentlichten Artikel ausführlich eine Methode zur Lösung des „Ausführens großer Modelle im Speicher von Mobiltelefonen“ und lieferte neue technische Ideen zur Lösung von Rechenengpässen auf Mobilgeräten.
In dem eingangs erwähnten Papier gaben Apple-Forscher außerdem bekannt, dass ReALM zwar eine kleinere Parametergröße aufweist, bei einigen Schlüsselindikatoren jedoch sogar GPT-4 übertrifft.
In welcher Form wird uns die KI Siri präsentiert? Bevor die WWDC 2024 kommt, können wir uns möglicherweise vom Android-Lager inspirieren lassen.
Auf der HarmonyOS 4-Konferenz im August letzten Jahres kündigte Yu Chengdong die Fähigkeit des intelligenten Assistenten Xiaoyi an, auf große KI-Modelle zuzugreifen. Unmittelbar danach gab Lei Jun bekannt, dass Xiaomi auf seinem Mobiltelefon ein großes Modell mit 1,3B-Parametern durchlaufen hat und die Auswirkungen einiger Szenen mit denen in der Cloud vergleichbar sind.
Keines der inländischen „Yuwujia“-Handys wurde zurückgelassen. OPPO Xiaobu Assistant basierend auf AndersGPT, Honor Magic 6 mit 7B-Terminal-seitigem KI-Großmodell und vivo mit Blue Heart-Großmodellmatrix wurden ebenfalls nacheinander offiziell angekündigt.
Dank des Segens großer Modelle überzeugen diese Sprachassistenten beim Verfassen von Texten, beim Zeichnen von Bildern usw., aber im Vergleich zu früheren Sprachassistenten unterscheiden sich ihre Anwendungsszenarien nicht.
Wenn AI Siri seine ursprüngliche Absicht neu erfinden und ein echter intelligenter Assistent werden möchte, muss es mindestens die folgenden Grundbedingungen erfüllen:
Erstens: Werden Sie intelligenter, das heißt, verbessern Sie die Verarbeitungsfähigkeiten natürlicher Sprache durch große Modelltechnologie. Zweitens: Einführung einer Voice-First-Schnittstelle, um das interaktive Erlebnis des Benutzers zu optimieren. Drittens: Erschließen Sie den Inselstatus aller Anwendungen und erreichen Sie eine nahtlose Datenintegration und Funktionen, was Siri zu einem wirklich umfassenden intelligenten Assistenten macht.
Obwohl es nicht einfach ist, eine der oben genannten drei Bedingungen herauszugreifen, gibt es auch einige Erfahrungen von Branchenpionieren, die als Referenz herangezogen werden können.
Auf dem Weg zur generativen KI besteht die schnellste Abkürzung manchmal darin, Hand in Hand zu gehen. Vor nicht allzu langer Zeit wurde bekannt, dass Apple, das „Nachzügler“ ist, mit Google, OpenAI und anderen Unternehmen über die Integration generativer KI-Dienste in iOS verhandelt 18.
Verglichen mit „deine Sprache klar hören“ ist „verstehen, was man meint“ das Haupthindernis für die Sprachinteraktion. Sogar Steve Jobs empfand dies zu Lebzeiten als schwierige Angelegenheit:
Spracherkennung ist in den nächsten 10 Jahren ein sehr spannendes Thema. Das Problem besteht eigentlich nicht nur darin, wie man Sprache erkennt. Wenn Sie mit jemandem sprechen, ist es viel schwieriger, seine Sprache zu verstehen, als nur die Sprache zu erkennen.
…Diese Angelegenheit ist ziemlich schwierig. Bis wir das Problem lösen, können Sie also nur auf diese wunderbare Zukunft hoffen.
Wie man in verschiedenen lauten und komplexen Umgebungen genau auf die Weckbedürfnisse des Benutzers reagiert und wie man vom semantischen Verständnis zum Gedächtnisverständnis übergeht, damit Siri sich an den Kontext und den Kontext des Benutzers erinnern und ihn analysieren und intelligentere Dienste und Vorschläge bereitstellen kann entscheidender Schritt von Siri auf dem Weg zur Intelligenz.
Das sind gerade die Stärken aktueller KI-Hardware.
Was den Abbau von Barrieren zwischen Anwendungen betrifft, ist die Integration von Software und Hardware zweitrangig. Im aktuellen Anwendungsökosystem sind Themen wie Datenaustausch und Datenschutz die Stolpersteine für Apple.
Vor dreizehn Jahren hätte man vielleicht ein iPhone gekauft, um Siri zu erleben. Damals war Siri nicht nur eine Funktion, sondern stellte auch eine neue Art der Interaktion dar, ein Medium, um die Zukunft des Lebens zu erkunden.
Dreizehn Jahre später hat sich Siri, das seine einstige Aura verloren hat, nach und nach von einem Innovationsschwerpunkt zu einer alltäglichen Zusatzfunktion gewandelt und ist im Leben mancher Nutzer sogar entbehrlich geworden.
Mit der Unterstützung großer Modelltechnologien, von kalten Klicks und Berührungen bis hin zur warmen Sprachkommunikation, erwarten wir, dass Siri nicht nur ein intelligentes System, sondern ein umfassender Partner ist, der unsere Sprache, Emotionen und Bedürfnisse verstehen kann.
Diese Art von Siri wird uns personalisiertere und rücksichtsvollere Dienste bieten und auch den Einsatz von Technologie menschlicher und voller Wärme machen.
# Willkommen beim offiziellen öffentlichen WeChat-Konto von aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich zur Verfügung gestellt.
Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo