Alexa könnte bald der Vergangenheit angehören

Forscher der Carnegie Mellon University haben ein System für die Interaktion mit intelligenten Lautsprechern und anderen sprachgestützten Geräten entwickelt, ohne Weckwörter zu verwenden.

Das System, das auf maschinellem Lernen beruht, könnte die Grundlage für eine sichere Alternative zu ständigen Heimassistenten sein.

Wie funktioniert das neue System?

Die neuen Ergebnisse wurden in einem Artikel von einem vierköpfigen Forschungsteam veröffentlicht, das auch ein Video zur Erläuterung der Funktionsweise des neuen Modells bereitstellte.

Die Forschung konzentriert sich auf die Richtung der Stimme , eine Technik, die sowohl die Position als auch den Blickwinkel der Sprache bestimmt. Dies unterscheidet sich von den heutigen intelligenten Geräten, die sich meist nur auf die Ursprungsposition eines Klangs konzentrieren. Der aktuelle Ansatz basiert auch auf einem bestimmten Weckwort, weshalb Sie durch Ändern von Alexas Weckwort in etwas anderes nur ein oder zwei weitere Optionen erhalten.

Wenn eine Person spricht, erzeugt ihre Stimme Echos im Raum, die alle zu unterschiedlichen Zeiten zu einem intelligenten Lautsprecher gelangen. Durch die Analyse des Timings, der Lautstärke und des Frequenzspektrums des Tons, den jedes reflektierte Echo erzeugt, kann das neue System vorhersagen, ob ein Benutzer in Richtung des intelligenten Objekts spricht oder wegblickt.

Neben dem Forschungsbericht stellte das Team auch einen GitHub-Link zu dem Datensatz bereit, der zum Trainieren des neuronalen Netzwerks verwendet wurde. Die 11520 eindeutigen Phrasen im Datensatz reichten aus, um einen intelligenten Lautsprecher zu trainieren, um den Winkel, dem ein Benutzer gegenüberstand, mit einer Genauigkeit von 90 Grad vorherzusagen.

Die zur Bestimmung der Richtung erforderlichen Berechnungen sind leicht genug, um lokal auf dem Gerät ausgeführt zu werden, ohne eine Verbindung zu einem Remote-Server herzustellen. Das Forschungsteam, das hinter den neuen Erkenntnissen steht, hofft, dass dieser Ansatz flüssigere Interaktionen mit intelligenten Geräten ermöglicht und den Benutzern mehr Datenschutz bietet als Cloud-basierte Alternativen.

Es gibt keinen Zeitplan, wann diese Technologie für den öffentlichen Gebrauch erscheinen könnte, aber die Grundlagen sind da, um die Notwendigkeit von Weckwörtern zu beseitigen. Wenn Sie einen intelligenten Lautsprecher nicht mehr beim Namen nennen müssen, braucht er dann wirklich einen?

Ein Ende für personifizierte Heimassistenten?

Während diese Forschung aufregende neue Möglichkeiten für die Interaktion mit intelligenten Geräten eröffnet, wird sie Weckwörter wahrscheinlich nicht vollständig ersetzen. Schließlich ist eine der Hauptattraktionen von intelligenten Lautsprechern, dass Sie mit ihnen rein stimmlich interagieren können, während Sie andere Aufgaben ausführen.

Es verspricht vielleicht eine Zukunft, in der mehrere intelligente Geräte im selben Raum verwendet werden können. Anstatt jedes intelligente Gerät in Hörweite zu aktivieren, können Sie ein einzelnes Gerät bitten, Ihnen den Wetterbericht leise zu übermitteln.

Es ist noch früh, aber eine solche Technologie könnte die nahtlose Interaktion von Science-Fiction zwischen Mensch und Computer in nicht allzu ferner Zukunft Wirklichkeit werden lassen.