Google hat stillschweigend aktualisiert: Alles, was Sie veröffentlichen, wird für das KI-Training verwendet

Juli 5, 2023 Eskere Guru

Es gibt keinen absoluten Müll auf der Welt, nur fehlgeleitete Ressourcen.

In der Mundpropaganda der Digital Natives der Generation Z ist die grobe Definition „99 % der öffentlichen Informationen im Internetzeitalter sind Müll“ längst gang und gäbe, und das Interessante ist, dass das Arsen des anderen mir gehört Schatz, und Google Die durch das Internet repräsentierten KI-Giganten haben begonnen, sich auf die im Internet veröffentlichten Informationen zu konzentrieren.

Kürzlich hat der Suchmaschinenriese Google seine Datenschutzrichtlinie aktualisiert, um öffentliche Informationen im Internet zum Trainieren von KI-Modellen zu nutzen. In der Datenschutzerklärung steht, dass Google nun dabei helfen kann, das KI-Modell von Google zu trainieren und praktische Funktionen wie Google Translate, Bard und Google Cloud AI aufzubauen, indem es öffentliche Informationen im Internet oder Informationen aus anderen öffentlichen Quellen sammelt. Darüber hinaus kann Google wird „Sprachmodell“ auf „KI-Modell“ zurückgesetzt.

Nach der Analyse der Medien OSCHINA zeigt diese Richtlinienaktualisierung, dass Google der Öffentlichkeit und seinen Nutzern nun klar macht, dass alle Inhalte, die sie öffentlich online veröffentlichen, Bard und seine zukünftigen Versionen sowie alle anderen entwickelten Produkte der künstlichen Intelligenz verwenden können von Google. .

AIGC-Systeme mit generativer künstlicher Intelligenz werden in der Regel auf der Grundlage umfangreicher Allzweckdaten im Internet vorab trainiert, wodurch die Generalisierung, Vielseitigkeit und Praktikabilität der KI erheblich verbessert werden, was unweigerlich zu Urheberrechts- und Datenschutzstreitigkeiten führen wird.

Derzeit könnte niemand dieses Dilemma besser verstehen als OpenAI.

Vor nicht allzu langer Zeit wurde OpenAI, die Muttergesellschaft des Chat-Roboters für künstliche Intelligenz ChatGPT, von zwei amerikanischen Autoren vor einem Bundesgericht in San Francisco verklagt, mit der Begründung, OpenAI habe keine Urheberrechtsgenehmigung erhalten und ihre Werke zum Trainieren künstlicher Intelligenz missbraucht.

Die offengelegte Anklageschrift zeigt, dass die Trainingsdaten von OpenAI mehr als 300.000 Bücher umfassen, darunter die umstrittene „Shadow Library“ mit unklarem Urheberrechtseigentum (hauptsächlich Bereitstellung kostenloser Bücher und Dokumente für die Öffentlichkeit in Form von Online-Sites mit Urheberrechtsverletzungsinhalten).

Darüber hinaus hat OpenAI erst gestern angekündigt, den offiziellen Webbrowsermodus von ChatGPT vorübergehend zu deaktivieren, was möglicherweise damit zusammenhängt, dass ChatGPT nicht in der Lage ist, die Paywall zu durchsuchen, um versteckte kostenpflichtige Inhalte zu erhalten. Nach der Urheberrechtsklage des amerikanischen Schriftstellers war OpenAI in der öffentlichen Meinung erneut stark in Urheberrechtsunruhen verwickelt.

Angesichts der Lehren aus der Klage gegen OpenAI ist es für Google daher vernünftig, seine Datenschutzrichtlinien im Voraus zu aktualisieren und sich im Voraus zu schützen.

Obwohl dieser Schritt das Risiko, dass Google „einen Rechtsstreit verschlingt“, effektiv verringert hat, hat er auch die Tatsache offengelegt, dass generative künstliche Intelligenz riesige Netzwerkdaten für das Training nutzt, was unweigerlich öffentliche Bedenken hinsichtlich des Datenschutzes geweckt hat. Auch das ausländische Medium Gizmodo kommentierte, dass es sich hierbei um ein neues und interessantes Datenschutzproblem handele.

Obwohl die Menschen im Allgemeinen verstehen, dass die im Internet öffentlich veröffentlichten Dateninformationen offen und kostenlos sind, besteht tatsächlich die psychologische Erwartung, dass andere auf die Dateninformationen zugreifen können, wenn man jedoch die enorme Menge an Dateninformationen im Internet berücksichtigt Als ihr eigener Hinterhof durch Internet-KI-Giganten werden sie es mutwillig nutzen, um künstliche Intelligenz zu trainieren. Ich glaube, dass es vielen Menschen „unbehaglich“ sein wird, dass ihre persönliche Domäne aus dem Nichts verletzt wurde, und daher eine vorsichtigere Einstellung dazu haben .

Nicht nur normale Nutzer sind von diesem Problem betroffen. Elon Musk kündigte kürzlich an, dass Twitter die Anzahl der täglich von Nutzern gelesenen Tweets „vorübergehend begrenzen“ wird: Nicht verifizierte Konten können nur 600 Tweets pro Tag sehen, für neue nicht verifizierte Konten nur 300 Einträge sind täglich zu sehen. Verifizierte Konten sind auf 6000 Beiträge pro Tag begrenzt.

Musk sagte, dass dies daran liegt, dass Hunderte von Organisationen (darunter einige KI-Unternehmen) Twitter-Daten kratzen, sodass diese das Erlebnis echter Nutzer beeinträchtigen.

Es ist nur so, dass das Dröhnen des damaligen Zuges manchmal ausreicht, um den unzufriedenen Lärm der Passagiere zu übertönen.

Wenn Googles Schritt legal und konform ist und die KI-Giganten diesem Beispiel folgen, werden wir vielleicht eines Tages alle Spuren unserer eigenen Existenz in generativer künstlicher Intelligenz finden.

#Willkommen, dem offiziellen öffentlichen WeChat-Konto von Aifaner zu folgen: Aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich präsentiert.

Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo