Diese KI hat meine Stimme mit nur drei Minuten Audio geklont

Es gibt eine Szene in Mission Impossible 3 , an die Sie sich vielleicht erinnern. Darin unser Held. Ethan Hunt (Tom Cruise). packt den Bösewicht des Films an, hält ihn mit vorgehaltener Waffe fest und zwingt ihn, eine bizarre Reihe von Sätzen laut vorzulesen.

Die Freude an Busbys Gesellschaft ist das, was ich am meisten genieße“ , liest er widerstrebend vor . „Er hat Miss Yancys Stuhl genagelt, und sie hat ihn einen schrecklichen Jungen genannt. Am Ende des Monats schleuderte er zwei Kätzchen quer durch den Raum … «

Obwohl es zufällig und unwichtig klingt, wird schnell klar, dass die Wörter, die er liest, überhaupt nicht zufällig sind – sie wurden absichtlich entwickelt, um einem Softwareprogramm zu helfen, seine Stimme zu klonen. Sobald er die Passage beendet hat, analysiert die Software das Audio und gibt Hunt sofort die Möglichkeit, genau wie der Bösewicht zu sprechen und zu klingen – das letzte Stück seiner nahezu perfekten Verkleidung.

Mission: Impossible 3 (2006) – Seeing Double Scene (5/8) | Filmausschnitt e

Wenn Sie nun diese Szene nehmen und all die Spionage, Waffen und dramatischen Spannungen abziehen, bleibt ein ziemlich solides Beispiel dessen, was ich heute auf der CES während einer Demo von My Own Voice erlebt habe, einem KI-gestützten „Voice Banking“. Service von einem französischen Startup namens Acapela Group.

Die Daseinsberechtigung des Unternehmens besteht darin, Menschen zu helfen, die irgendwann die Sprache verlieren. Dies ist typischerweise etwas, das als Folge von Verletzungen, Krankheiten oder Krankheiten wie ALS, Huntington-Krankheit und Kehlkopfkrebs passiert. Was auch immer die Ursache sein mag, die My Own Voice-Plattform des Unternehmens ermöglicht es einer Person, ihre Stimme synthetisch zu klonen und den einzigartigen Ton, die Klangfarbe und die Persönlichkeit zu bewahren, die sie zu ihrer eigenen machen – etwas, das normalerweise bei den meisten Text-zu-Sprache-Software verloren geht (denken Sie an Stephen Hawking).

Nun, um fair zu sein, die Technologie zum Klonen von Stimmen ist zu diesem Zeitpunkt nicht unbedingt neu oder technologisch bahnbrechend. Solche Dienste gibt es seit Jahren, und teilweise dank des Aufkommens von Deepfakes gibt es derzeit Dutzende anderer Unternehmen, die dasselbe tun können wie die Acapela Group. Aber es gibt zwei große Dinge, die My Own Voice vom Rest des Rudels abheben: Geschwindigkeit und Zielstrebigkeit.

Superschnelles KI-Sprachklonen auf der CES #shorts

My Own Voice ist beeindruckend schnell. Im Gegensatz zu anderen Diensten, die oft stundenlanges Referenzaudio benötigen, um einen realistisch klingenden Klon zu erstellen, kann die KI von My Own Voice eine erstaunlich gute Synthese erzeugen, nachdem sie nur 50 kurze Sätze oder ungefähr 3 Minuten aufgezeichnetes Audio gehört hat. Es ist im Grunde genau wie diese Mission Impossible-Szene; Sie haben einen optimierten Satz von Referenzsätzen entwickelt, mit denen ihre KI leichter lernen kann, wie Sie klingen. Anstatt also jedes erdenkliche Wort manuell aufzuzeichnen, müssen Sie nur eine Handvoll einfacher Sätze durchsprechen.

Wohl wichtiger als die Geschwindigkeit der Software ist jedoch ihr Zweck. Auch diese Technologie ist nicht besonders neu oder neuartig. Es gab eine Handvoll bemerkenswerter Startups, die ähnliche Voice-Cloning-Technologien entwickelt haben – wie zum Beispiel das kanadische Startup Lyrebird oder die in London ansässige Firma Sonantic. Aber beide Startups wurden schnell übernommen, und ihre Voice-Cloning-Technologie wurde schließlich für KI -Overdubbing in Filmen und Videobearbeitungssoftware verwendet .

Das soll nicht heißen, dass dies keine gute Verwendung von Voice-Cloning-Technologie ist. Das sind sie auf jeden Fall, und sie sind wahrscheinlich ziemlich profitabel obendrein – aber genau das macht My Own Voice so cool. Es kommt nicht oft vor, dass Sie auf eine so leistungsstarke Technologie stoßen, die nicht für Unterhaltung oder Produktivität gebaut wurde, sondern speziell entwickelt wurde, um benachteiligten Menschen zu helfen und ihnen buchstäblich eine Stimme zu geben.