Insider-Enthüllung von Apples Siri-Team: Kämpfe, Kämpfe, Umstrukturierung
Microsoft investierte in OpenAI und brachte das neue Bing auf den Markt, Google brachte Bard auf den Markt, Adobe brachte FireFly auf den Markt, Amazon brachte Amazon Titan auf den Markt, und mit der Popularität von ChatGPT brachen KI-Tools oder Assistenten von großen Unternehmen aus dem Silicon Valley sofort aus.
▲ Copilot-Funktion von Github
Nur Apple, das in einer Ecke Kaliforniens angesiedelt ist, scheint nach außen eine Welt zu sein, die nicht von KI gestört wird.
Schweigen
Nachdem sie den verrückten Marsch der KI miterlebt haben, betreten große und kleine Unternehmen nacheinander das AIGC-Feld, markieren alle die Beta-Testversion und müssen eine Wartelistenphase durchlaufen.
Sie mögen am Ende falsch liegen, sie können die Frage nicht beantworten und sie können sogar einen Höhepunkt der öffentlichen Meinung hervorrufen, aber das Silicon Valley und wir beteiligen uns immer noch gerne daran.
Relativ gesehen hat Apple zu AIGC immer geschwiegen, und weder Führungskräfte noch Mitarbeiter haben Apples wahre Ansichten dazu geäußert.
Apple hat immer sehr darauf geachtet, das eigene Image und die eigene Unternehmensmarke zu pflegen, und sie kündigen selten unausgereifte Produkte oder Technologien nach außen an.
Daher erklärt sich auch, warum Apple bei neuen Technologien immer langsamer ist als andere Unternehmen.
Apple versucht sein Bestes, um inakzeptable Phänomene zu vermeiden, wenn neue Technologien auf Produkte angewendet werden.
Derzeit drehen sich die meisten Produkte in der AIGC-Branche noch um Webseiten-Dialogfelder, und die Killer-Anwendung befindet sich noch in einer leeren Phase.
Für Apple, das sich auf Produkte konzentriert, ist es sinnvoll, sich nicht zu äußern.
Allerdings planen die Apple-Ingenieure nach den aus den Informationen gewonnenen Informationen, das große Sprachmodell LLM mit Siri zu kombinieren, um ein intelligenteres Siri auf den Markt zu bringen, das natürlich auf das iOS des nächsten Jahres angewendet wird.
Genau wie 2011 kündigte Apple erstmals den smarten Assistenten Siri an, der zusammen mit dem iPhone 4s auf den Markt kam und in diesem Jahr zu einem großen funktionalen Upgrade des iPhone wurde.
hochkarätig
Aus heutiger Sicht hat Apple dem Chip eine neurale Engine hinzugefügt, die den SoC-Chip „bionisch“ nennt und verschiedene Modelle und Algorithmen der künstlichen Intelligenz auf Fotografie, Biometrie, Schreiben usw. anwendet.
Die große Optimierung und Verbesserung des Nutzererlebnisses fällt den Menschen oft schwer auf, Apple setzt KI eher zurückhaltend ein.
Aber im Jahr 2011 wurde Siri als Apples bekannteste Technologie für künstliche Intelligenz vorgestellt.
▲ Scott Forstall
Bis jetzt erinnere ich mich noch, dass Scott Forstall, als er Siri vorstellte, sagte, dass Siri natürliche Sprache verstehen kann, dass Benutzer sich keine bestimmten Formate und Grammatiken merken müssen und dass sie auch an Benutzergewohnheiten angepasst werden können.
Im anschließenden Werbevideo ist Siri wirklich zu einem im Mobiltelefon integrierten Assistenten geworden, der immer richtig reagiert und ziemlich intelligent und menschlich ist.
Es ist nur so, dass die technische Iteration von Siri nach 2011 zu stagnieren scheint. Mehr als zehn Jahre später folgt sie immer noch der „naiven“ Antwort von 2011.
Wenn die Leute ständig von den fortschrittlicheren Sprachassistenten anderer Unternehmen aufgefrischt werden, wirkt Siri ein wenig ungeschickt und zu niedlich.
Insbesondere hat Siri inzwischen fast alle Geräte von Apple abgedeckt, einschließlich iPhone, iPad, Mac und sogar AirPods.Siris leicht altmodische Verarbeitungs- und Antwortmethoden machen es noch veralteter.
Sogar Apple ist intern von Siri enttäuscht: Apples XR-Geräteentwicklungsteam will Siri nicht zur Steuerung von Geräten und Funktionen auf XR-Geräten verwenden, weil es nicht intelligent genug ist.
Zu diesem Zweck überlegte auch Mike Rockwell, der Verantwortliche für XR-Equipment, eine Alternative zu finden, um die Sprachsteuerung von Siri zu ersetzen, scheiterte aber letztendlich.
Das gemunkelte Apple XR-Headset wird immer noch anderen Apple-Geräten ähneln, mit einfacher Steuerung mit Siri und natürlich einer einfachen Konversation damit, wenn Sie möchten.
klettern
Die Veröffentlichung von Siri gilt als Wendepunkt in der Geschichte der Smartphones. Nach Siri werden fast alle Smartphone-Hersteller einen ähnlichen smarten Assistenten für ihre Produkte auf den Markt bringen, um nicht ins Hintertreffen zu geraten.
Apple hat 2010 200 Millionen Dollar für die Übernahme von Siri Inc. ausgegeben und ein Jahr später Siri in das iPhone integriert.
Danach bildete Apple auch ein Siri-Team für intelligente Assistenten.Von 2011 bis 2018 geriet das Siri-Team jedoch in Verwirrung, und es gab einige Debatten über das interne Management und die allgemeine Richtung.
▲ Johannes Giannandrea
Apples Lösung besteht darin, „einen Experten einzuladen.“ Im Jahr 2018 wurde John Giannandrea von Google eingestellt, um Apples Senior Vice President zu werden, der für Strategien für künstliche Intelligenz und maschinelles Lernen verantwortlich ist.
Davor war er bei Google für Search Business und Artificial Intelligence verantwortlich und kann fast schon als Senior Experte auf dem Gebiet der Künstlichen Intelligenz von Google bezeichnet werden.
Mit der Hinzufügung von John Giannandrea will Apple auf seine Erfahrung zurückgreifen, um den Status quo von Siri schrittweise zu verbessern und Siri dabei zu helfen, zur Konkurrenz aufzuschließen.
John Giannandrea brachte auch eine Google-ähnliche Arbeitsatmosphäre in das Siri-Team, und wenn Apple-Führungskräfte sofortige Änderungen in Siri brauchten, würde er den Prozess des „Erklimmens des Berges“ nutzen, um zu erklären, wie die Probleme im Bereich der künstlichen KI gelöst werden können Intelligenz.
Für Siri oder Apples Strategie der künstlichen Intelligenz muss es ein langfristiges Ziel geben, bei dem sich jede kleine Optimierung und Änderung im Laufe der Zeit ansammelt, und es darf nicht schlampig sein.
Mit anderen Worten, John Giannandrea glaubt, dass Apples Fundament in der künstlichen Intelligenz zu schwach ist, um es zu überstürzen.
Darüber hinaus überzeugte er auch das Top-Management von Apple, dass es sich vorerst auf Teambuilding konzentrieren, relevante Talente halten und ihnen mehr Freiheit geben sollte, ihre eigenen interessierten Richtungen zu erforschen und zu entwickeln.
Am wichtigsten ist, dass John Giannandrea das Gehaltsniveau des Teams für künstliche Intelligenz deutlich auf Industriestandards erhöht hat.
Nach drei Tricks wurde Apples Team für künstliche Intelligenz verstärkt, viele ehemalige Google-Experten für künstliche Intelligenz wurden eingestellt und das Machine-Learning-Startup Laserlike wurde für 150 Millionen US-Dollar übernommen.
Seine drei Gründer, Srinivasan Venkatachary, Steven Baker und Anand Shukla, wurden später zum Siri-Team, Experten im LLM- und Suchbereich von Apple.
Der Zweck der Einführung von Laserlike besteht eigentlich darin, die Suchfunktionen von Siri zu verbessern, und Venkatachary ist natürlich der Leiter von Apples Suchteam geworden.
Im Jahr 2019 fügte Apple Siri die Möglichkeit hinzu, Benutzerfragen über Netzwerkinformationen zu beantworten. Die Funktionalität von Siri wird nach und nach vervollständigt und erweitert.
Allerdings sind diese Änderungen eher „Eintagsfliegen“.
Es gibt einige Projekte innerhalb des Apple-Teams für künstliche Intelligenz, darunter das BlackBird-Projekt, das Siri auf das iPhone portieren kann, und SiriX, ein Projekt, das den zehnten Geburtstag von Siri feiert.
Zusätzlich zum internen Wettbewerb sind Apples Top-Führungskräfte jedoch zu langsam, um Entscheidungen über die allgemeine Richtung der künstlichen Intelligenz zu treffen, und sie sind zu konservativ beim Einsatz neuer Technologien wie LLMs.
▲ Von A nach A Bild von: der Information
Im Herbst 2022 verließen auch Srinivasan Venkatachary, Steven Baker und Anand Shukla Apple für Google.
Interessanterweise rekrutierte Google-CEO Sundar Pichai das dreiköpfige Team persönlich, und auch Tim Cook behielt es.
Aber sie denken, dass Google ein geeignetes Unternehmen ist, um LLM zu erforschen, und es wird schnell auf Produkte angewendet.
Jetzt studieren sie bei Google, wie sie die Trainingskosten für große Sprachmodelle reduzieren und die Genauigkeit verbessern können.
Nicht nur das Laserlike-Team, sondern auch die meisten anderen von Giannandrea rekrutierten Experten und Teams haben Apple verlassen, weil Apple der Erforschung künstlicher Intelligenz offenbar nicht viel Aufmerksamkeit schenkt.
Nach der Ankunft von John Giannandrea, der gerade dabei war, den Berg im Bereich der künstlichen Intelligenz zu erklimmen, war es vielleicht anders als die allgemeine strategische Ausrichtung des Unternehmens, was dazu führte, dass die künstliche Intelligenz von Apple zu kämpfen hatte.
Kampf
Der Datenschutz ist eine Strategie auf Unternehmensebene, die Apple kürzlich verfolgt hat.
Angesichts dessen muss alles kompromittiert und niemals kompromittiert werden.
John Giannandrea kam zu Apple mit dem klaren Ziel, Siri intelligenter zu machen, indem Apple die Nutzung von Benutzerdaten und Trainingsalgorithmen optimiert.
Denn in Unternehmen wie Google und Amazon ist es Routine, Nutzerdaten zu sammeln und zu analysieren, um Produktalgorithmusmodelle zu verbessern.
Auch aufgrund dieses Prozesses wird der Algorithmus intelligenter und die KI wird intelligenter.
Apple hat zuvor Konversationsdaten zwischen Siri und Benutzern gesammelt, ohne sich an die ID zu erinnern, aber es hat dies weder professionell getan, noch hat es diese Daten verwendet, um Siri zu verbessern.
Mit der Ankunft von John Giannandrea fand Apple viele Outsourcing-Unternehmen, um relevante Daten zu sammeln, und optimierte schließlich Siri durch einen Prozess.
Aber im Jahr 2019 enthüllte The Guardian, dass das Outsourcing-Team von Apple die Gespräche zwischen Benutzern und Siri ohne Zustimmung abhörte, was einen Aufruhr auslöste, insbesondere bei Apple, das sich immer auf den Datenschutz konzentriert hat.
Zu diesem Zweck ersetzte Apple schließlich Outsourcer durch Vollzeitmitarbeiter und modifizierte interne Prozesse und Richtlinien, um es normalen Mitarbeitern fast unmöglich zu machen, Siri-Gesprächsaufzeichnungen zu hören.
Solche Vorschriften erschweren es dem Team der künstlichen Intelligenz auch, in Echtzeit zu optimieren und pünktlich zu iterieren, und es ist auch einer der Gründe, warum Siri derzeit sehr klassisch aussieht.
„Die Mängel ihrer Arbeit werden immer offensichtlicher“, sagte Pedro Domingos, Professor für Informatik an der University of Washington und Autor des maschinellen Lernbuchs „The Master Algorithm (The Master Algorithm)“. Daten, um wettbewerbsfähiger zu sein.“
▲ Tim Cook Bild von: Bloomberg
Und für einige von Siris seltsamen Antworten, die oft zu heißen Suchen führen, wird es auch Tim Cooks Aufmerksamkeit erregen. Wird den Prozess oft überspringen und das Siri-Team direkt bitten, "peinliche" Antworten zu ändern.
Um die Datenerfassung aus Datenschutzgründen zu reduzieren, peinliche Antworten zu vermeiden und manuelle Korrekturen vorzunehmen, legt Apple großen Wert auf sein Unternehmensimage.
Obwohl Apple jetzt über riesige Mittel und Ressourcen verfügt, glauben viele ehemalige Mitglieder des Apple-Teams für künstliche Intelligenz, dass es für Apple schwierig ist, LLM-basiertes Siri bald einzusetzen.
Darüber hinaus hat Apple auch viele Regeln in Siri festgelegt, z. B. wenn nach dem Preis eines iPhones gefragt wird, wird vorrangig auf die offizielle Website von Apple umgeleitet, anstatt direkt eine Antwort zu geben.
Apple ist kein technologieorientiertes Unternehmen, alle ihre Dienste und Technologien dienen Produkten, das heißt, sie können mehr iPhones, iPads und Macs verkaufen.
Daher hat das Designteam lange Zeit ein erhebliches Mitspracherecht und ist der Meinung, dass das Produkt zu 100% perfekt sein sollte.
Dieses Streben hat auch das Siri-Team für künstliche Intelligenz fortgesetzt, aber als Algorithmus ist es unmöglich, 100 % genau zu sein, und Fehler sind unvermeidlich. Nur wenn wir Fehler machen, können wir verwandte Modelle besser optimieren.
Die unterschiedlichen Aktivitäten zwischen ihnen machen die Arbeit des Teams für künstliche Intelligenz auch sehr stressig. Auf Giannandreas Überzeugung hin musste das Softwaredesignteam Siri eine Schaltfläche hinzufügen, mit der Benutzer melden können, ob die Antwort richtig war.
Ob es darum geht, auf Datenschutz oder Workflow-Probleme zu bestehen oder ein 100 % perfektes Produkt herzustellen, das Team für künstliche Intelligenz von Siri erlebt eine Reihe von Kämpfen, genauso wie es großen Unternehmen wie Google und Amazon die Hände gebunden sind der künstlichen Intelligenz.
Unbekannt
Dieses „Unbekannte“ kann sich tatsächlich auf viele Dinge beziehen.
Apples Team für künstliche Intelligenz hat viele Verbesserungen an Siri vorgenommen, darunter Siri X, BlackBird, Pegasus und andere Projekte.
Obwohl einige Mitglieder des Projekts gegangen sind, stehen diese Projekte endlich kurz vor dem Abschluss und können jederzeit ersetzt oder in das aktuelle Siri optimiert werden.
Wie von John Giannandrea befürwortet, ist ein Modell der künstlichen Intelligenz jedoch eigentlich ein ziemlich kompliziertes Projekt, das den ganzen Körper betrifft.
Blindes Modifizieren und Ersetzen kann zu unvorhersehbaren Problemen führen.
Außerdem verlassen sich die Antworten von Siri im Vergleich zu anderen Sprachassistenten wie Amazons Alexa oder Googles Assistant stark auf menschliches Engagement.
Mit anderen Worten, die Datenbank von Siri hat viele menschliche Einschränkungen und Eingriffe.Nach mehr als zehn Jahren der Modifikation und Anpassung ist die Datenbank kompliziert und langwierig geworden.
Darüber hinaus unterscheidet es sich auch von der Datenbank-Arbeitsweise des aktuellen großen LLM-Sprachmodells, da es nicht einfach eine API-Schnittstelle hinzufügen kann, um ChatGPT reibungslos auszuführen und ähnliche Funktionen zu haben.
Was Apple jetzt entscheiden muss, ist, ob es ein Smart Siri will, es stürzen und neu anfangen oder es Schicht für Schicht optimieren soll.
Darüber hinaus bestreitet niemand die Rentabilität, den Cashflow und die enormen Ressourcenmobilisierungsfähigkeiten von Apple. Darüber hinaus gibt es auch Hardware-Ressourcen und Wissensreserven wie Chips und Terminals.
Wenn Apple entschlossen ist, sich dem AIGC-Bereich zu widmen, kann es komplexe große Sprachmodelle trainieren und seine eigene generative KI entwickeln.
Aber Apple muss entscheiden, ob es „das Rad neu erfinden“ oder seine Vision und Ressourcen in die Anwendung von AIGC auf das Terminal und seine Einbettung in die Ökologie investieren muss.
Schließlich laufen diese LLMs, die komplexe Dienste wie ChatGPT unterstützen, immer noch in der Cloud, und es ist immer noch leer, sie auf das Terminal-Ökosystem anzuwenden.
Beim Personaltransfer setzt Apple aktuell eher auf Experten für visuelle Erkennung, relativ gesehen auch auf das für XR Virtual Reality geeignete Feld.
Für Apple ist die Technologieexplosion in der AIGC-Branche weniger als ein Jahr alt, und wie man sie auf Apple-Produkte anwendet, ist immer noch ein sehr vorläufiger Versuch.
Und Apple bereitet sich seit vielen Jahren darauf vor, das iPhone als nächsten großen Trend der XR-Virtual-Reality-Ausrüstung zu ersetzen, vielleicht ist es das Produkt, um das sich Apple am meisten kümmern und auf dessen Entwicklung es sich konzentrieren sollte.
Um Siri in Smart Siri oder Siri Copilot zu verwandeln, lassen Sie das KI-Team unter der Leitung von John Giannandrea für eine Weile den Berg erklimmen.
#Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so bald wie möglich präsentiert.
Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo