Wie funktionieren Cat Speech Translation Apps?
Sie haben wahrscheinlich Apps gesehen, die behaupten, zu übersetzen, was Ihre Katze sagt. Aber können sie den Miau Ihrer Katze wirklich ins Englische übersetzen? Die kurze Antwort lautet ja, irgendwie. Es ist schwierig, weil die "Sprache" jeder Katze einzigartig ist, aber sie kann mit moderner Technologie ziemlich nahe kommen.
Katzenübersetzungs-Apps wie MeowTalk verwenden eine Form der Spracherkennung, bei der maschinelles Lernen im Vordergrund steht. Schauen wir genauer hin.
Spracherkennung und maschinelles Lernen
Die Spracherkennung zeichnet Sprache auf und wandelt das Audio in eine digitale Datendatei um. Es codiert Daten wie Tonhöhe und Lautstärke als Datenpunkte, die die App analysieren und mit Bedeutungen abgleichen kann. DPA Microphones erklärt, dass diese Datenpunkte abhängig von den Hintergrundgeräuschen und der Art und Weise, wie ein Wort gesprochen wird, sehr unterschiedlich aussehen können.
Wir halten Spracherkennung manchmal für selbstverständlich, aber es ist eine unglaubliche technologische Leistung. Besonders wenn man bedenkt, wie komplex die menschliche Sprache ist. Wie der Wissenschaftler erklärt, beinhaltet jedes Wort eine breite Palette von Lauten oder "Phonemen", die ineinander übergehen. Es ist sehr schwierig, einen Computer dazu zu bringen, Sprache zu verstehen. Die neue Grenze der Katzengeräusche wird noch schwieriger.
Apps, die Spracherkennung verwenden, werden mit einem "Wortschatz" von Wörtern programmiert, der als Datensatz bezeichnet wird. Die App ordnet Ihre Rede dann der nächstgelegenen Option in ihrem Datenvokabular zu.
Wenn es einen Fehler macht, korrigieren Sie ihn und es speichert diese Daten für das nächste Mal. Dies ist Teil des maschinellen Lernens. Auf diese Weise lernt ein Programm, Sprache zu erkennen, auch wenn sie nicht mit dem Datensatz identisch ist, mit dem es begonnen hat.
Die Spracherkennung hat immer noch Probleme, insbesondere mit Sprachbehinderungen und Akzenten. Einige Unternehmen verbessern jedoch das maschinelle Lernen, um diese Probleme zu lösen . Im Laufe der Zeit kann maschinelles Lernen die Spracherkennung zu einem leistungsstarken Werkzeug machen.
So funktioniert Spracherkennung beim Menschen. Aber funktioniert es bei Katzen?
Spracherkennung vs. Miauerkennung
Zunächst müssen wir verstehen, warum sich die Übersetzung einer bestimmten Art von Miau als "Ich habe Hunger" von der Analyse der menschlichen Sprache unterscheidet. Das Problem ist meistens, dass die Kommunikation mit Katzen stärker von nonverbalen Hinweisen wie der Körperhaltung abhängt. Ein weiteres Problem ist das Fehlen einer universellen "Katzensprache".
Laut ASPCA miauen sich erwachsene Wildkatzen niemals gegenseitig an, sondern nur Menschen. Andere Forschungen der Humane Society fügen hinzu, dass diese Geräusche "nicht im luftleeren Raum auftreten". Wir müssen sie neben der Körpersprache und anderen Kontexten interpretieren. In vielen Fällen sind diese stillen Signale der einzige Unterschied zwischen einem Miau, das "Ich habe Hunger" bedeutet, und einem Miau, das "Ich möchte spielen" bedeutet.
Zusätzlich zu diesem Problem haben keine zwei Katzen dieselbe Sprache. Katzen entwickeln personalisierte "Sprachen" für ihre Besitzer. Diese basieren teilweise auf der Nachahmung der Stimme des Besitzers und teilweise auf der Persönlichkeit der Katze. Keine zwei Katzen klingen gleich, auch wenn sie das gleiche Bedürfnis oder Bedürfnis vermitteln. Wie kann das Sprachvokabular einer App für alle übersetzt werden?
Flexibles maschinelles Lernen für Katzen
Obwohl einige virtuelle Assistenten wie Oto versuchen, Ton und Emotionen zu verstehen, ist die Spracherkennung bei nonverbalen Signalen immer noch schrecklich. Das heißt aber nicht, dass es unmöglich ist, sie zu interpretieren.
MeowTalk verwendet eine flexiblere Art des maschinellen Lernens, um diese Probleme zu lösen.
Herunterladen: MeowTalk für Android | iOS (kostenlos)
Meowtalk wurde von Javier Sanchez erstellt, der auch im Alexa-Team arbeitete. Er stellte sich die App als einen Schritt in Richtung intelligenter Halsbänder vor. Diese Halsbänder würden Katzengeräusche in menschliche Sprache übersetzen und dabei auf komplexe Strategien des maschinellen Lernens zurückgreifen, um den Menschen zu helfen, ihre Katzen besser zu verstehen und zu pflegen.
Das MeowTalk-Team kompensierte Probleme mit der Einzigartigkeit, indem es für jede Katze spezifischere Profile erstellte. In der App registrieren Sie jede Katze separat. Science Norway berichtet, dass Kätzchen anders miauen als erwachsene Katzen, daher fragt die App auch nach dem Geburtstag der Katze. Jedes Profil generiert ein eindeutiges Datennetzwerk für die Katze, das ein wenig tiefes Lernen in das maschinelle Lernen einbezieht.
Für den Wortschatz beginnt MeowTalk mit 10 Klangprofilen in seinem Datensatz. Jeder hat eine andere Bedeutung, wie "glücklich" oder "Jagd". Wenn die App einen Ton hört und ihn falsch versteht, können Sie ihn entweder korrigieren oder eine neue Interpretation erstellen.
Durch das Korrigieren wird die App angewiesen, das Basisvokabular durch den neuen Sound zu ersetzen.
Zum Beispiel können Sie der App mitteilen, dass "Jagd" mit kurzen Zwitschern anstelle eines langen Jaulens abgeglichen werden soll. Diese Art der Korrektur ist nützlicher als das Hinzufügen mehrerer Töne, die mit einem übereinstimmen, was der Art und Weise entspricht, wie die Spracherkennung funktioniert. Dies wäre so, als würde man der App sagen, dass ein langes Jaulen und ein kurzes Zwitschern beide "Mutterruf" bedeuten.
Maschinelles Lernen in Spracherkennungs-Apps widersteht normalerweise dieser Art des Überschreibens. Es wäre, als würde man versuchen, Siri beizubringen, dass man mit "Technologie-Blog" wirklich "Birne" meint. Die flexiblere Form des maschinellen Lernens, die MeowTalk verwendet, kann diese Korrektur jedoch leichter handhaben.
Durch das Erstellen einer neuen Interpretation wird eine Bedeutung hinzugefügt, die zuvor nicht codiert wurde. Wenn Ihre Katze beispielsweise einen bestimmten Anruf hat, wenn sie ihr Lieblingsspielzeug haben möchte, können Sie optional "Ich möchte meine Maus" hinzufügen. Es ähnelt dem Hinzufügen eines Wortes zu Ihrem Autokorrektur-Wörterbuch.
Im Laufe der Zeit können Sie ein hochgradig personalisiertes Sprachprofil für Ihre Katze entwickeln. Schließlich könnte es sogar so ausgefeilt sein, dass es für Tierbetreuer nützlich ist oder Verhaltensprobleme löst. Wenn nichts anderes, hilft es Katzenbesitzern, ihre Haustiere aufmerksamer zu machen.
Das Urteil: Funktionieren Cat Translation Apps?
Letztendlich hängt die "Katzenübersetzung" immer noch stark davon ab, dass der Benutzer der App beibringt, wie ihre Katze spricht. Dies wird wahrscheinlich immer der Fall sein, da die Kommunikation jeder Katze einzigartig ist.
Aber die Tatsache, dass maschinelles Lernen so weit fortgeschritten ist, dass Entwickler dies teilweise sogar schaffen können, ist unglaublich. Maschinelles Lernen und KI schreiten mit rasender Geschwindigkeit voran, und wir können es kaum erwarten, zu sehen, wohin sie als nächstes gehen.