Das gesamte Internet gehört mittlerweile der KI von Google

Juli 6, 2023 Eskere Guru

Google Bard wird auf der Google I/O 2023 vorgestellt.

Googles neueste Aktualisierung seiner Datenschutzrichtlinie wird dafür sorgen, dass das Unternehmen freie Hand hat, das Web nach Inhalten zu durchsuchen, die für den Aufbau und die Verbesserung seiner KI-Tools von Nutzen sein können.

„Google nutzt Informationen, um unsere Dienste zu verbessern und neue Produkte, Funktionen und Technologien zu entwickeln, die unseren Nutzern und der Öffentlichkeit zugute kommen“, heißt es in der neuen Google-Richtlinie. „Zum Beispiel nutzen wir öffentlich verfügbare Informationen, um die KI-Modelle von Google zu trainieren und Produkte und Funktionen wie Google Translate, Bard und Cloud AI-Funktionen zu entwickeln.“

Gizmodo weist darauf hin, dass die Richtlinie aktualisiert wurde und nun „KI-Modelle“ heißt, während zuvor „für Sprachmodelle“ stand. Darüber hinaus wurden Bard und Cloud AI in die Richtlinie aufgenommen, während zuvor nur Google Translate erwähnt wurde, für das Daten gesammelt wurden.

Die am Wochenende aktualisierte Datenschutzrichtlinie erscheint besonders bedrohlich, da sie darauf hinweist, dass alle von Ihnen online produzierten Informationen für Google zum Trainieren seiner KI-Modelle zur Verfügung stehen.

Die oben genannte Formulierung scheint auf die eine oder andere Weise nicht nur diejenigen im Google-Ökosystem zu beschreiben, sondern ist auch so detailliert, dass die Marke Zugriff auf Informationen aus jedem Teil des Webs haben könnte.

Die Hauptthemen im Zusammenhang mit der Massenentwicklung künstlicher Intelligenz sind Fragen zum Datenschutz, zu Plagiaten und zur Frage, ob KI korrekte Informationen vernichten kann. Frühe Versionen von Chatbots wie ChatGPT basieren auf großen Sprachmodellen (LLMs), die bereits öffentliche Quellen wie das Common Crawl Web Archive, WebText2, Books1, Books2 und Wikipedia als Trainingsdaten verwendeten.

Früher war ChatGPT dafür berüchtigt, bei Informationen über das Jahr 2021 hinaus hängen zu bleiben und anschließend Antworten mit falschen Daten zu füllen. Dies könnte wahrscheinlich einer der Gründe sein, warum Google uneingeschränkten Zugriff auf Webdaten haben möchte, um Tools wie Bard zu nutzen und ein reales und möglicherweise Echtzeit-Training für seine KI-Modelle zu ermöglichen.

Gizmodo wies auch darauf hin, dass Google diese neue Richtlinie nutzen könnte, um alte, aber immer noch von Menschen erstellte Inhalte zu sammeln, wie etwa längst vergessene Rezensionen oder Blog-Beiträge, um immer noch ein Gefühl dafür zu haben, wie menschlicher Text und Sprache entwickelt und verbreitet werden. Es bleibt jedoch abzuwarten, wie Google die gesammelten Daten genau verwenden wird.

Mehrere Social-Media-Plattformen, darunter Twitter und Reddit, die wichtige Quellen für aktuelle Informationen sind, haben im Zuge der Popularität von KI-Chatbots bereits ihren öffentlichen Zugang eingeschränkt , zum Leidwesen ihrer gesamten Communities.

Beide Plattformen haben den freien Zugriff auf ihre APIs gesperrt, wodurch Benutzer unter dem Deckmantel des Schutzes ihres geistigen Eigentums daran gehindert werden, große Mengen an Beiträgen herunterzuladen, um sie an anderer Stelle zu teilen. Dadurch wurden stattdessen viele Tools von Drittanbietern kaputt gemacht, die dafür sorgen, dass sowohl Twitter als auch Reddit reibungslos funktionieren.

Sowohl Twitter als auch Reddit mussten sich mit anderen Rückschlägen und Kontroversen auseinandersetzen, da die Besorgnis ihrer Eigentümer über die Übernahme der KI zunahm.