Wie erkennt Shazam Musik genau?

Haben Sie sich jemals gefragt, wie Shazam die Musik, die Sie spielen, "hört" und sie mit solcher Genauigkeit identifiziert? Nun, du bist nicht allein.

Die Technologie, die den Musikerkennungsdienst antreibt, ist vielen ein Rätsel, insbesondere seit der Dienst Jahre vor dem Start von Smartphones und maschinellem Lernen eingeführt wurde.

In diesem Artikel werden wir uns ansehen, wie Shazam funktioniert und wie es Musik genau erkennen kann.

Was ist Shazam?

Shazam ist eine beliebte Musikerkennungs-App, mit der Sie Informationen zu einem neuen Song finden können, den Sie lieben, den Titel oder den Namen des Künstlers jedoch nicht kennen.

Angenommen, Sie sind in einem Café oder gehen um ein Eckgeschäft und hören ein neues Lied, das Sie gerne in Ihrer Musikbibliothek haben würden. Shazam hilft Ihnen dabei, das Lied mühelos zu finden. Sie müssen lediglich einige Sekunden des Songs in der App aufnehmen.

Die Shazam-App verwendet eine ausgefeilte Audioerkennungstechnologie, um die Musik, die Sie hören, in Sekundenschnelle zu identifizieren, sodass Sie den Namen des Künstlers herausfinden und verfolgen, Videos ansehen und sogar den Titel auf Ihrem Gerät kaufen oder streamen können.

Herunterladen: Shazam für iOS | Android (kostenlos)

Wie funktioniert Shazam?

Bildergalerie (4 Bilder)

Shazam verwendet eine proprietäre Technologie, die von Avery Lin-Chun Wang, dem Mitbegründer und leitenden Datenwissenschaftler der App, entwickelt wurde, um Übereinstimmungen für auf seiner Plattform abgefragte Songs zu identifizieren. Die Technologie erstellt Fingerabdrücke für Audioaufnahmen. Dies ist die geheime Sauce hinter Shazams hervorragenden Erkennungsfähigkeiten.

Shazam erstellt und speichert Audio-Fingerabdrücke, die aus Sammlungen numerischer Daten für jeweils über 15 Milliarden Songs bestehen. Wenn ein Benutzer ein Lied „Shazams“ macht, erstellt Shazam schnell einen Audio-Fingerabdruck des vom Smartphone oder PC-Mikrofon empfangenen Tons.

Sobald der Audio-Fingerabdruck für die Aufnahme erstellt wurde, lädt Shazam den Audio-Fingerabdruck (nicht das Audio) auf seinen Server hoch und führt dort eine Datenbanksuche nach Übereinstimmungen durch. Wenn eine Übereinstimmung gefunden wird, werden die Song-Informationen mit Optionen zum Streamen oder Kaufen sowie den identifizierenden Informationen zurückgegeben.

Was ist ein Audio-Fingerabdruck?

Ein Audio-Fingerabdruck ist eine komprimierte digitale Zusammenfassung von Audiosignalen. Sie werden verwendet, um ein Audiobeispiel zu identifizieren oder ähnliche Elemente in einer Audiodatenbank zu finden.

Die Audio-Fingerabdrucktechnologie von Shazam kann unbeschriftete Audioinhalte mit entsprechenden Übereinstimmungen in der Audiodatenbank abgleichen. Shazam identifiziert den Titel des von Ihnen aufgenommenen Songs (einen unbeschrifteten Audioinhalt), indem der Fingerabdruck des Songs mit dem Fingerabdruck der Songs in seiner Datenbank abgeglichen wird.

Shazam erstellt anhand bestimmter Datenpunkte, die mit Hilfe eines Spektrogramms identifiziert wurden, eindeutige Fingerabdrücke für Songs in seiner Datenbank.

Was ist ein Spektrogramm?

Ein Spektrogramm ist ein dreidimensionaler Graph, der als Darstellung des Klangs verwendet wird. Das Spektrogramm zeigt die Änderung der Frequenzen über einen Zeitraum unter Berücksichtigung der Amplitude oder des Volumens. Das Foto unten ist ein Beispiel für eine Spektrogrammablesung.

Wie erkennt Shazam Musik genau? - spectrogram audio fingerprint

In einem Interview mit Scientific American aus dem Jahr 2003 enthüllte Avery Wang, dass der Shazam-Algorithmus Spektrogrammpunkte verwendet, die Noten mit der höchsten Energie darstellen, um Audio-Fingerabdrücke zu erzeugen.

Indem Shazam die meisten Informationen in einem Song ignoriert und sich nur auf die wenigen definierenden Noten konzentriert, kann er seine Datenbank durchsuchen und mit unglaublicher Geschwindigkeit genaue Übereinstimmungen für Songabfragen liefern.

Wie kann Shazam Songs an lauten Orten identifizieren?

Shazam verwendet Songaufnahmen, die frei von Hintergrundgeräuschen und Verzerrungen sind, um Fingerabdrücke für seine Datenbank zu erstellen. Wenn Sie einen Song mit der App an einem lauten Ort aufnehmen, wird ein Audio-Fingerabdruck Ihrer Aufnahme erstellt, indem die Noten mit der höchsten Energie auf der Aufnahme identifiziert werden.

Anschließend durchsucht es seine Datenbank nach einer Übereinstimmung mit den Audio-Fingerabdrücken Ihrer Aufnahme, vorausgesetzt, der Hintergrundgeräuschpegel war nicht hoch genug, um die zur Erstellung des Audio-Fingerabdrucks verwendeten Daten zu verzerren.

Zeiten, in denen Shazam Ihnen nicht helfen kann, einen Song zu identifizieren

Shazam ist großartig darin, Songs zusammenzubringen, selbst obskure Musik, von der Sie glauben, dass sie nicht in seiner Datenbank enthalten ist. Aber gibt es Momente, in denen Shazam keine Spur identifizieren kann?

Verzerrte Aufnahme

Wenn Sie ein Lied an einem Ort Shazam machen, an dem der Hintergrundgeräuschpegel zu hoch ist, verzerrt das Rauschen die Daten im Spektrogramm. Aus diesem Grund unterscheidet sich der Audio-Fingerabdruck Ihrer Aufnahme von dem des Original-Songs.

In diesem Fall gibt Shazam den Dialog " Song not Known" zurück, da keine Übereinstimmung mit dem Audio-Fingerabdruck gefunden werden kann.

Live Musik

Shazam ist nicht in der Lage, Musik von Live-Auftritten zu identifizieren. Dies liegt daran, dass das Audio, das Sie in Live-Auftritten aufnehmen, häufig von der Originalversion des Songs abweicht, mit dem Shazam Audio-Fingerabdrücke erstellt.

Die einzige Möglichkeit, wie Shazam einen Song während einer Live-Performance identifizieren kann, besteht darin, dass die Band fähig genug ist, den Song genau so zu spielen, wie er aufgenommen wurde. Viel Glück mit der Band, die versucht, das zu tun ...

Ihre Sprachaufnahme

"Könnte ich Shazam dazu bringen, ein Lied zu erkennen, das ich gesungen habe, wenn ich ein wirklich guter Sänger wäre?"

Kurz gesagt, nein.

Der Shazam-Algorithmus kann nur aufgezeichnete Musik identifizieren. Damit Shazam einen Song identifizieren kann, den Sie singen, müssen Sie den gleichen Gesang wie die Instrumentals im exakten Tempo der Originalaufnahme des Songs haben.

Dein Summen

Shazam kann keine Übereinstimmungen für Brummen identifizieren, da sein Algorithmus exakte Frequenzen und Amplituden verwendet, um Audio-Fingerabdrücke für die Songs in seiner Datenbank zu erstellen.

Wenn Sie ein Lied summen, erstellt Shazam einen Fingerabdruck dafür. Da ein Brummen jedoch nur ein Versuch ist, ein Lied neu zu synthetisieren, stimmt der Algorithmus nicht mit der Aufnahme überein.

Ist Shazam die einzige Musikidentifikations-App?

Shazam war der erste Musikidentifikationsdienst und ist derzeit die am weitesten verbreitete App zur Identifizierung von Liedern. Es gibt jedoch andere Apps, mit denen Sie einen Titel identifizieren können , der um Sie herum abgespielt wird. Einige können sogar ein Lied identifizieren, das Sie singen oder summen.

Drei der beliebtesten Shazam-Alternativen sind SoundHound, Musixmatch Lyrics und Genius. Musixmatch und Genius helfen Ihnen in erster Linie dabei, Texte für Musik zu identifizieren, die um Sie herum spielt, während SoundHound Shazams engster Konkurrent ist.

Verwandte: Die besten Musikerkennungs-Apps, um Songs nach ihrer Melodie zu finden

Sie können die SoundHound-App verwenden, um so ziemlich alles zu tun, was Shazam tut. Sein Hauptvorteil gegenüber Shazam ist, dass es die zusätzliche Funktionalität hat, Songs zu identifizieren, die Sie singen oder summen.

Bildnachweis : Sulastri Sulastri / Shutterstock.com