Das KI-Erkennungstool von Google ist jetzt für jedermann zum Ausprobieren verfügbar

Google gab am Mittwoch in einem Beitrag auf X (ehemals Twitter) bekannt, dass SynthID nun für jeden verfügbar ist, der es ausprobieren möchte. Das Authentifizierungssystem für KI-generierte Inhalte bettet nicht wahrnehmbare Wasserzeichen in generierte Bilder, Videos und Texte ein, sodass Benutzer überprüfen können, ob ein Inhalt von Menschen oder Maschinen erstellt wurde.

„Wir stellen unser Wasserzeichen-Tool SynthID Text als Open-Source-Lösung zur Verfügung“, schrieb das Unternehmen. „Es steht Entwicklern und Unternehmen kostenlos zur Verfügung und hilft ihnen, ihre KI-generierten Inhalte zu identifizieren.“

SynthID wurde 2023 als Mittel zum Wasserzeichen von KI-generierten Bildern, Audio- und Videodateien eingeführt . Es wurde zunächst in Imagen integriert, und das Unternehmen gab anschließend im vergangenen Mai auf der I/O 2024 seine Integration in den Gemini-Chatbot bekannt .

Das System funktioniert durch die Codierung von Tokens – das sind die grundlegenden Datenblöcke (sei es ein einzelnes Zeichen, ein Wort oder ein Teil einer Phrase), die eine generative KI verwendet, um die Aufforderung zu verstehen und das nächste Wort in ihrer Antwort vorherzusagen – mit nicht wahrnehmbaren Wasserzeichen während des Textgenerierungsprozesses. Dies geschieht laut einem DeepMind-Blog vom Mai , indem „zusätzliche Informationen in die Token-Verteilung zum Zeitpunkt der Generierung eingefügt werden, indem die Wahrscheinlichkeit der Token-Generierung moduliert wird“.

Durch den Vergleich der Wortauswahl des Modells zusammen mit seinen „angepassten Wahrscheinlichkeitswerten“ mit dem erwarteten Bewertungsmuster für Text mit und ohne Wasserzeichen kann SynthID erkennen, ob dieser Satz von einer KI geschrieben wurde.

Laut einer am Mittwoch in Nature veröffentlichten Studie hat dieser Prozess keinen Einfluss auf die Genauigkeit, Qualität oder Geschwindigkeit der Reaktion und kann auch nicht einfach umgangen werden. Im Gegensatz zu Standard-Metadaten, die leicht entfernt und gelöscht werden können, bleibt das Wasserzeichen von SynthID Berichten zufolge auch dann erhalten, wenn der Inhalt zugeschnitten, bearbeitet oder auf andere Weise geändert wurde.

„Das Erreichen einer zuverlässigen und nicht wahrnehmbaren Wasserzeichenkennzeichnung von KI-generiertem Text ist eine grundsätzliche Herausforderung, insbesondere in Szenarien, in denen die Ergebnisse [großer Sprachmodelle] nahezu deterministisch sind, wie z. B. Sachfragen oder Codegenerierungsaufgaben“, so Soheil Feizi, außerordentlicher Professor an der University of Maryland , sagte er gegenüber MIT Technology Review und stellte fest, dass sein Open-Source-Charakter „der Community ermöglicht, diese Detektoren zu testen und ihre Robustheit in verschiedenen Umgebungen zu bewerten, was dazu beiträgt, die Grenzen dieser Techniken besser zu verstehen.“

Das System ist jedoch nicht narrensicher. Obwohl es manipulationssicher ist, können die Wasserzeichen von SynthID entfernt werden, wenn der Text über eine Sprachübersetzungs-App ausgeführt wird oder wenn er stark umgeschrieben wurde. Weniger effektiv ist es auch bei kurzen Textpassagen und bei der Feststellung, ob eine auf einer sachlichen Aussage basierende Antwort von der KI generiert wurde. Beispielsweise gibt es auf die Frage „Was ist die Hauptstadt von Frankreich?“ nur eine richtige Antwort. und sowohl Menschen als auch KI werden Ihnen sagen, dass es Paris ist.

Wenn Sie SynthID selbst ausprobieren möchten, können Sie es von Hugging Face als Teil des aktualisierten Responsible GenAI Toolkits von Google herunterladen.