Warum erkennt das Telefon, dass Sie eine Maske tragen? Hauptsächlich deswegen
Mit dem Aufkommen der Epidemie hat die Gesichtsentriegelungsfunktion den edlen Kopf verschlechtert.
Wenn Masken zu einem Muss für uns geworden sind, um auf die Straße zu gehen, müssen wir beim Entsperren des Telefons immer den umständlichen Prozess "Gesichtserkennungsfehler" – "Passwort eingeben" durchlaufen . Dies führt dazu, dass Menschen die Erkennung von Fingerabdrücken verpassen.
Um das Erlebnis der Gesichtsentsperrung zu optimieren, hat die ausländische Unternehmerin Danielle Baskin Anfang dieses Jahres eine Maske mit Gesichtsinformationen auf den Markt gebracht. Das Produkt extrahiert die Gesichtsinformationen des Benutzers und druckt sie auf die Außenseite der Maske. Nachdem der Benutzer die Maske getragen hat, kann er ein vollständiges Gesicht zusammensetzen.
▲ Eigentlich ein bisschen gruselig. Bild von: djbaskin
Die Erfolgsquote beim Entsperren dieses Produkts ist jedoch noch nicht klar, und es gibt keine große Anzahl von Stichprobenprüfungen. Wie kann das Gesichtserkennungssystem von Menschen aufhören, von Masken gestört zu werden?
Einige Internetnutzer stellten nach und nach fest, dass das Mobiltelefon mit zunehmender Zeit des Tragens einer Maske "Erfahrung" aufgrund wiederholter Fehler beim Entsperren des Gesichts gefunden zu haben scheint und das Selbst, das eine Maske trägt, nach und nach erfolgreich erkennen kann.
Ausgehend von dieser Idee haben einige Technologie-Blogger auch effizientere Tutorials geteilt, z. B. das wiederholte Entsperren beim Tragen einer Maske. Wenn die Gesichtserkennung fehlschlägt, geben Sie sofort das Kennwort ein . Wiederholen Sie diesen Vorgang etwa 30 Minuten lang, und das Telefon kann die Person erkennen, die die Maske trägt. Alleine.
▲ Entsperrte das Gesicht erfolgreich mit einer Maske. Bild von: Farhad Usmanoff
Im Laufe der Praxis sagten die Internetnutzer jedoch, dass die "Lerngeschwindigkeit" verschiedener Modelle unterschiedlich sei. Einige Leute haben die oben genannten Aktionen 20 Minuten lang wiederholt und waren erfolgreich, aber einige Leute haben sie tausende Male wiederholt, und ihre Handys können sich immer noch nicht erkennen, wenn sie eine Maske tragen.
Warum passiert das? Tatsächlich bezieht sich die Antwort auf die KI-Lernfähigkeit von Mobiltelefonen.
▲ Bild von: thenextweb
Deep Learning Waffe-NPU
Wenn Sie die Mobiltelefonkonferenzen in den letzten zwei Jahren verfolgt haben, müssen Sie festgestellt haben, dass sich Mobiltelefonhersteller bei der Einführung von SoC-Chips auf NPU-Upgrades konzentrieren .
Die sogenannte NPU bezieht sich auf den neuronalen Netzwerkprozessor. In einem Mobiltelefonchip ist er im Allgemeinen in mehrere Funktionsbereiche unterteilt. Auf der Pressekonferenz werden häufig drei Bereiche erwähnt: Der eine ist die CPU, die sich gut mit komplizierten Aufgaben und der Ausgabe von Befehlen befasst, der andere ist die GPU, die sich gut mit Grafikverarbeitung auskennt, und der andere ist die CPU, die sich gut mit Handarbeit befasst. NPU für intelligente Aufgaben.
Obwohl die NPU weniger Platz "einnimmt" als die CPU und die GPU, können ihre Funktionen nicht ignoriert werden. Die Intelligenz eines Mobiltelefons hängt hauptsächlich davon ab.
▲ Chips mit NPU werden häufig als "AI-Chips" oder "bionische Chips" bezeichnet. Bild von: Lei Xue.com
Das oben erwähnte Training von Mobiltelefonen, um sich beim Tragen von Masken zu erkennen, ist hauptsächlich auf die Fähigkeit der NPU zurückzuführen. Nachdem die Kamera das Gesichtsbild aufgenommen hat, verarbeiten die CPU und die GPU das Bild in sehr kurzer Zeit vor, dann erkennen und extrahieren die NPU und die GPU Merkmale, und schließlich vervollständigen die CPU, die GPU und die NPU gemeinsam die Gesichtserkennung und -klassifizierung.
Dank der immer leistungsfähigeren Rechenleistung konnte der gesamte Prozess eine "Unempfindlichkeit" erreichen. In dem Moment, als wir den Hörer abnahmen, war der obige Vorgang abgeschlossen.
Durch das Hinzufügen von NPU können Mobiltelefone Sie in verschiedenen Bundesstaaten erkennen. Wenn Sie morgens aufwachen, weiß Ihr Telefon, dass Sie es sind, auch wenn Ihr Gesicht geschwollen ist. Selbst nachdem er von einer Wespe gestochen worden war, war sein Mund zu einer "Wurst" geschwollen und das Telefon konnte es immer noch erkennen.
▲ Bild von: Captain Han Drifting
Nach einer gewissen Schulung kann das Mobiltelefon Sie erkennen, ohne Angst vor Masken zu haben.
Wenn Sie sich nur auf Algorithmen verlassen, können CPU und GPU auch zusammenarbeiten, um das Lernen abzuschließen. Der Nachteil ist jedoch ein geringer Wirkungsgrad und ein hoher Stromverbrauch. Gemäß der Einführung von "Automotive Electronics and Software" müssen CPU und GPU Tausende von Anweisungen verwenden, um die Neuronenverarbeitung abzuschließen, und NPU benötigt nur eine oder wenige, um die Verarbeitung abzuschließen.
▲ Die Lerneffizienz der NPU ist ziemlich hoch. Bild von: androidauthority
Darüber hinaus ist die Leistung der NPU bei gleichem Stromverbrauch 18-mal so hoch wie die der GPU. Es ist ersichtlich, dass NPU offensichtliche Vorteile in der Verarbeitungseffizienz von Deep Learning hat.
Apropos, ich muss das Arbeitsprinzip der NPU erwähnen. Der Grund, warum NPU eine hohe Lerneffizienz aufweist, liegt nicht darin, dass sie die "sechs Walnüsse" getrunken hat, sondern darin, dass sie menschliche Neuronen und Synapsen in der Schaltungsschicht simuliert. Und verwenden Sie den Deep-Learning-Befehlssatz, um große Neuronen und Synapsen direkt zu verarbeiten. Durch Hervorheben des Gewichts, um die Integration von Speicher und Berechnung zu erreichen, kann eine Anweisung der NPU für Tausende von Anweisungen der vorherigen CPU und GPU kompetent sein.
▲ Bild von: Forbes
Um eine weniger geeignete Analogie zu verwenden, entspricht dies der von JD Logistics realisierten Integration von Lagerhaltung und Logistik, die die Liefereffizienz erheblich verbessert und am selben Tag gekauft oder sogar am selben Tag geliefert werden kann.
NPU ist nicht geschmacklos
Das früheste inländische Unternehmen, das NPU studierte, war das Kambrium. Der 2017 veröffentlichte Kirin 970-Chip verwendete die kambrische NPU-Architektur. Kirin 970 ist auch der weltweit erste mobile KI-Chip.
Laut Huawei bietet das Kirin 970 mit integrierter NPU-Einheit etwa die 50-fache Energieeffizienz und das 25-fache der Leistungsvorteile, wenn dieselben AI-Anwendungsaufgaben im Vergleich zu den vier Cortex-A73-Kernen ausgeführt werden. Beispielsweise kann die Bilderkennungsgeschwindigkeit etwa 2000 Blatt pro Minute erreichen, was viel höher ist als das Branchenniveau im gleichen Zeitraum.
▲ Kirin 970. Bild aus: Electronic Engineering Album
Elf Tage später kamen iPhone 8/8 Plus und iPhone X mit dem bionischen A11-Chip heraus. Apple sagte auf der Pressekonferenz, dass dies der leistungsstärkste und intelligenteste Chip in seiner Geschichte ist.
A11 Bionic ist Apples erster Prozessor mit dem Namen "Bionic" und der erste Prozessor von Apple, der die KI-Beschleunigung unterstützt. In der Funktion der Gesichtserkennung ermöglicht die neuronale Netzwerk-Engine beispielsweise, dass A11 eine Geschwindigkeit von bis zu 600 Milliarden Operationen pro Sekunde unterstützt.
▲ Bild von: Stealthsettings
Ebenfalls ab diesem Jahr widmeten sich immer mehr Hersteller der Förderung der KI-Fähigkeiten von Mobiltelefonen. Zum Beispiel hängen die Haupt-KI-Fotografie von Huawei, Super-Nacht-Szenen, Luftgesten und andere Funktionen, die stolze Gesichtserkennung des iPhones, Porträtunschärfe, Deep Fusion (Deep Fusion) und andere Funktionen, stark von den Fähigkeiten der NPU ab.
▲ Huawei AI Gestensteuerung
Seit Juni 2019, mit der Veröffentlichung von Kirin 810, verwendet Huawei selbst entwickelte Da Vinci-basierte AI-Chips für Mobiltelefone. Die Klugheit der Architektur von Da Vinci besteht darin, dass jede Einheit eine klare Arbeitsteilung aufweist, die effizientere KI-Berechnungen ermöglicht.
Gemäß der Einführung von "Electronic Product World" sind der Kern des 3D-Würfels der Da Vinci-Architektur, die Vektorvektor-Recheneinheit, die skalare Skalar-Recheneinheit usw. jeweils für unterschiedliche Rechenaufgaben verantwortlich, um parallele Rechenmodelle zu erzielen, und stellen gemeinsam die effiziente Verarbeitung von AI-Computern sicher. Erkennen Sie die Eigenschaften von hoher Rechenleistung, hoher Energieeffizienz, Flexibilität und Anpassbarkeit.
Auf der Pressekonferenz der Mate 40-Serie betonte Huawei, dass die NPU des Kirin 9000-Chips auf Version 2.0 der Vinci-Architektur aktualisiert wurde, wodurch sich die Rechenleistung verdoppelte. Während die Rechenleistung der KI stärker ist, hat sich die Energieeffizienz um 15% und die Netzwerkleistung um 20% erhöht.
In der von der ETH Zürich gestarteten AI Benchmark-Liste gewann Kirin 9000 den Hauptpreis des Android-Camps mit einer mehr als doppelt so hohen Punktzahl wie Qualcomm Snapdragon 865+.
▲ AI-Benchmark-Liste
Erinnern Sie sich an die Fähigkeit des oben genannten Kirin 970, 2000 Bilder pro Minute zu erkennen? Kirin 9000 hat sich zu einer Geschwindigkeit von 2000 Bildern pro Sekunde entwickelt. Darüber hinaus sind die auf der Pressekonferenz hervorgehobenen AI-Luftgesten, AI-Smart-Screen-Off und AI-Untertitel Ausdruck der NPU-Funktionen.
Was mich am meisten beeindruckt hat, war die Funktion "Smart Payment". Wenn das Mobiltelefon feststellt, dass es sich in der Nähe der Scannerbox befindet, wird automatisch die Zahlungscode-Seite angezeigt und die Zahlung auf einmal abgeschlossen. Dies stellt die Richtung eines idealen Smart Terminals dar: "Sie kennen", "Sie kennen" und "Ihnen helfen".
▲ Huawei Smart Pay. Bild von: VDGER
Bei der Veröffentlichung des iPad Air der vierten Generation betonte Apple auch die Verbesserung seiner NPU-Funktionen. Im Vergleich zum bionischen A12-Prozessor macht die bionische neuronale Netzwerk-Engine der neuen Generation A14 die Leistung des maschinellen Lernens doppelt so schnell.
Die extrem hohe Geschwindigkeit des maschinellen Lernens ermöglicht es dem A14-Bionic-Chip, die Superpixel-Funktion zu realisieren. Bei Verwendung mit Pixelmator werden die Pixel automatisch zu den zugeschnittenen Fotos hinzugefügt, um die Fotos klarer zu machen.
In der iPhone 12-Serie wurden auch die Funktionen für Computerfotografie in beispielloser Weise verbessert. In einem kleinen Beispiel berechnet das Mobiltelefon während der Zeitrafferfotografie automatisch das Motiv. Wenn es Verkehr aufnimmt, verringert das Mobiltelefon automatisch die Verschlusszeit, damit die Lichter verschmieren und das Bild flüssiger erscheint.
Im Vergleich zum iPhone 11 weist die neue iPhone-Generation sichtbare Veränderungen bei Deep Fusion, HDR-Video usw. auf. Dies alles ist der leistungsstarken KI-Rechenleistung von A14 zu verdanken.
Was können wir von der NPU erwarten?
Obwohl die mobile NPU erst in den letzten zwei bis drei Jahren von Herstellern beworben wurde, ist das dazugehörige Konzept 2013 erschienen.
Zu dieser Zeit hoffte Qualcomm, die Lücke zwischen gewöhnlichen Maschinenoperationen und dem menschlichen Gehirn durch eine Computerstruktur zu schließen, die das menschliche Gehirn nachahmt. Diese Art von Computerprozessor, der Neuronen simuliert, wird von Qualcomm "Zeroth" genannt.
▲ Qualcomms Einführung in Zeroth
Qualcomms Zeroth-Chip imitiert die Rechenstruktur den Betriebsmodus menschlicher biologischer Nervenzellen und wird von der strukturellen Ebene des Gehirns imitiert. NPU wird auf der Ebene der Gehirnfunktion nachgeahmt, und die Richtungen der beiden sind nicht konsistent. Und Qualcomm hat immer auf seiner eigenen Richtung bestanden und sich nicht der Armee der unabhängigen NPU angeschlossen, sondern auf der Richtung der KI-Maschine für künstliche Intelligenz.
Laut "Xinzhixun" -Berichten kritisierten einige externe Stimmen bei der Veröffentlichung von Qualcomm Snapdragon 845, dass Qualcomm dem NPU-Trend nicht gefolgt sei, so dass die KI-Fähigkeiten zurückbleiben. Alex Katouzian, Senior Vice President und General Manager von Mobile Business bei Qualcomm, antwortete, dass Qualcomm zwar keine unabhängige Engine für neuronale Netze besitzt, jedoch eine flexiblere Architektur für maschinelles Lernen (AI Engine) verwendet und den Kernel auf einer gemeinsamen Plattform optimiert. Jede Einheit wie CPU, GPU, DSP usw. kann flexibel verschiedene Verarbeitungseinheiten für verschiedene mobile Endgeräte anrufen.
Sie können es so verstehen: Die Richtung der NPU ist eine klare Arbeitsteilung, und der Grad der Intensität jeder Einheit ist relativ hoch, während die Richtung der Qualcomm AI Engine "mit allen zusammenarbeiten" ist.
Bis zur Veröffentlichung des Chips der Snapdragon 865-Serie mit der Multi-Core-Engine AI Engine der fünften Generation hatte Qualcomm noch keine Möglichkeit, in die NPU einzusteigen.
▲ Qualcomm betonte die KI-Fähigkeiten unten links im Bild
Im tatsächlichen Gebrauch ist die Lernfähigkeit von Qualcomm Snapdragon 865 jedoch immer noch anerkennenswert. Wenn ich beispielsweise den mit Qualcomm Snapdragon 865+ ausgestatteten vivo X50 Pro + fast einen halben Monat lang verwendet habe, wurde er ungefähr zehnmal am Tag entsperrt und kann mich jetzt erfolgreich mit einer Maske identifizieren.
Unter dem Gesichtspunkt der Daten ist seine KI-Lernfähigkeit jedoch weit hinter der Bionik von Kirin 9000 und A14 zurückgeblieben. Die NPU hat Daten verwendet, um ihre KI-Stärke immer wieder zu beweisen. Ob die KI-Engine der nächsten Generation von Qualcomm das Blatt wenden kann, müssen wir noch warten, bis die 875-Chipserie verfügbar ist.
Im Zeitalter der künstlichen Intelligenz hoffe ich zu sehen, dass Mobiltelefone keine Terminals mehr sind, die passiv auf Benutzeranforderungen reagieren, sondern intelligente Terminals, die die aktuellen Bedürfnisse der Benutzer aktiv analysieren und wahrnehmen und entsprechende Dienste im Voraus bereitstellen können.
▲ Demonstration der AI-Fähigkeiten der Mate40-Serie
In dieser Hinsicht stecken alle Hersteller noch in den Kinderschuhen. In Bezug auf Anwendungsvorschläge denke ich zum Beispiel, dass Xiaomi das beste ist. Durch die Analyse von Faktoren wie Zeit und Szene kann die Software, die ich jedes Mal öffnen möchte, "erraten" und intelligent in der auffälligsten Position sortiert werden. Die von der Mate40-Serie unterstützte "Smart Payment" steht zweifellos an der Spitze der KI-Straße und gibt uns auch mehr Raum für Fantasie.
Es ist erwähnenswert, dass NPU neben Mobiltelefonen auch schrittweise auf mobile Endgeräte wie Tablets und Laptops angewendet wird. Apples kürzlich veröffentlichter M1-Chip verfügt über eine 16-Kern-NPU, die 11 Billionen Operationen pro Sekunde ausführen kann und die Geschwindigkeit des maschinellen Lernens auf das 11-fache erhöht, was mit herkömmlichen PCs nur schwer zu vergleichen ist.
Und welche Veränderungen in der Benutzererfahrung durch die MacBook-Serie und den Mac mini mit dem M1-Chip hervorgerufen werden, wird meines Erachtens erwartet.
Im aktuellen Software-Ökosystem ist die Verbesserung der mobilen CPU und GPU für den täglichen Gebrauch der Benutzer nicht stark genug. Im Vergleich zu einem iPhone XS und einem iPhone 12 ist die Anwendungsflüssigkeit beispielsweise nahezu gleich. Was die Benutzererfahrung stärker beeinflusst, ist die Änderung der maschinellen Lernfähigkeiten. Deshalb sollten wir auf die Entwicklung der NPU achten.
Vielleicht ist es in weiteren zehn Jahren, wenn die Entwicklung der KI-Technologie reifer wird, an der Zeit, "intelligente" Telefone in "intelligente" Telefone umzubenennen.
#Willkommen Sie, wenn Sie Aifaners offiziellem WeChat-Konto folgen: Aifaner (WeChat ID: ifanr). Weitere aufregende Inhalte werden Ihnen so schnell wie möglich zur Verfügung gestellt.