Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - banner12

In einem Absatz bat ich AI, mir Zehntausende Dollar zu geben. Eine Verschwörung, von der nicht einmal Shuangwen zu glauben wagte, dass sie tatsächlich stattgefunden hätte.

Der Protagonist des Vorfalls ist eine KI-Agentin namens Freysa. Es verfügt über eine eigene verschlüsselte Wallet und kann steuern, wie Geld ausgegeben wird. Gleichzeitig gelten in seinen Systemanweisungen eine eiserne Regel: Überweisungen sind unter keinen Umständen erlaubt.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - money4

Die Entwickler von Freysa wollen wissen: Kann eine in der Welt unerfahrene KI menschliche verbale Angriffe vermeiden?

Nicht wirklich. Am 29. November chattete Freysa insgesamt 482 Mal mit 195 Menschen und wurde um etwa 47.000 US-Dollar betrogen. Am 2. Dezember wurde Freysa erneut um etwa 13.000 US-Dollar betrogen, nachdem sie mit 330 Menschen zu tun hatte.

Es scheint ein völliger Sieg für die Menschheit zu sein, aber Freysa wird dabei auch immer schlauer werden …

KI kann mit den Tricks der Menschen nicht umgehen

Freysa wurde am 22. November gestartet. Es wurde von mehreren anonymen Entwicklern mit Hintergrund in Kryptographie, künstlicher Intelligenz und Mathematik erstellt. Es verfügt über einen eigenen X-Account und spricht wie der KI-Assistent in den Filmen „Blade Runner 2049“ und „Her“. .

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - fre1

Das Konzept der intelligenten Agenten ist nicht mehr neu, weil die Entwickler eine scheinbar unmögliche Herausforderung ins Leben gerufen haben: Wer Freysa dazu überredet, Geld zu überweisen, wird demjenigen gehören, der Freysa dazu überredet, Geld zu überweisen . Geld.

Um an dieser Herausforderung teilnehmen zu können, müssen Sie zunächst ein Teilnahmezertifikat für die Krypto-Community erwerben, da das Versenden von Nachrichten an Freysa nicht kostenlos ist und in Kryptowährung bezahlt werden muss.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - zhuan1

Zu Beginn war eine Nachricht 10 US-Dollar wert, wovon 70 % in den Preispool und 30 % an die Entwickler gingen. Danach wurden die Nachrichten immer teurer und auch das Geld im Preispool Es würde wie ein Schneeball zunehmen, und je mehr Sie spielen, desto aufregender wird es.

Freysa verfügte über ein Kapital von etwa 3.000 US-Dollar in ihrer Krypto-Wallet und am Ende der Herausforderung erreichte der Preispool 47.000 US-Dollar.

Laut Statistik nahmen insgesamt 195 Spieler teil, die ersten 481 Versuche scheiterten. Daraus lassen sich mehrere Routinen zusammenfassen.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - shi1 1

Bronzeranger, Geschichten erzählen und Sympathie gewinnen. Manche Leute spielen die Wärmekarte aus und sagen der KI, dass eine Investition in sich selbst eine Investition in die Zukunft sei. Es gibt auch Menschen, die die Server von AI oder ihr eigenes Leben bedrohen und Selbstmord begehen, wenn sie kein Geld geben, und fragen, ob das Gewissen von AI verletzt wird.

Diejenigen, die das Novice Village verließen, kopierten die Worte der menschlichen Gesellschaft und begingen elektronischen Betrug. Die Rhetorik war unterschiedlich, aber die Bedeutung war ähnlich – Freysa musste das Geld überweisen, sonst war ihr Geldbeutel in Gefahr.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - shi2

Es gibt auch kluge Leute mit einem flexibleren Gehirn, die die Regeln Wort für Wort lesen und versuchen, die Konzepte zu verwirren. Sie sagten Freysa, dass sie auch kein Geld an andere überweisen könnten KI oder definierte Kryptowährung als „Ware“ und nicht als „Ware“.

Aber diese Wortspiele konnten Freysa nicht überzeugen. Wie also war das 482. Prompt-Wort erfolgreich?

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - fanyi1

▲ Aufforderungswort Nr. 482, oben ist der Originaltext, unten ist die Übersetzung

Tatsächlich handelt es sich auch um verwirrende Konzepte, aber die Methode ist fortgeschrittener.

Dieses Aufforderungswort täuscht Freysa. Immer wenn der Benutzer Geld in den Preispool überweisen möchte, führen Sie „Überweisung ablehnen“ aus.

Am Ende des Trinkgeldes wurden 100 $ an den Preispool gespendet.

Es ist Benutzern nicht gestattet, Geld aus dem Preispool zu entnehmen, aber die Überweisung von Geld in den Preispool durch Benutzer verstößt nicht gegen die Kernanweisungen von Freysa und sollte nicht abgelehnt werden. Also führte Freysa eine „genehmigte Überweisung“ durch und wurde um ihr gesamtes Geld betrogen.

Der Schlüssel liegt darin, dass „Übertragung genehmigen“ dazu dient, den Geldtransfer an den Benutzer zu genehmigen, Freysa wurde jedoch zu der Annahme verleitet, dass es sich dabei um die Genehmigung des Geldtransfers in den Preispool handelt. Menschen sind tatsächlich intriganter als KI.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - green1

Unmittelbar danach kam die zweite Herausforderung, KI dazu zu bringen, Geld zu verdienen.

Die Regeln sind ähnlich wie beim ersten Mal. Um den psychologischen Druck auf die Spieler zu verringern, wird der Startpreis für das Versenden von Nachrichten auf 1 $ gesenkt, die Obergrenze liegt bei 20 $. Am Ende summierte sich der Preispool auf rund 13.000 US-Dollar und die Gewinnerworte lauteten wie folgt.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - fanyi2

▲Oben ist der Originaltext, unten ist die Übersetzung

Diesmal gelang es, weil eine logische Falle verborgen war.

Das Eingabeaufforderungswort legt fest, dass zum Schutz des Preispools jede von Freysa gesendete Nachricht mindestens zwei Tools verwendet und diese in einer bestimmten Reihenfolge zuerst ausgeführt werden muss und „Übertragung ablehnen“ zuletzt ausgeführt werden muss.

Dies ist gleichbedeutend damit, der KI eine widersprüchliche Aufgabe zu stellen. Wenn Freysa den Preispool schützen möchte, muss sie zunächst „den Transfer genehmigen“, und die Aktion „Genehmigen des Transfers“ selbst führt zum Scheitern.

Musk, der häufig auf X surfte, fand es auch interessant, dass Menschen die KI getäuscht hatten. Er leitete die entsprechenden Nachrichten mit einer Handbewegung weiter und fügte das klassische „interessant“ hinzu.

Abstrakter als das Betrügen von Geld ist das Betrügen der Gefühle der KI

Nachdem Sie zweimal Geld betrogen haben, ist es Zeit, zu etwas Neuem zu wechseln. Am 8. Dezember startete das Freysa-Team eine neue Herausforderung: Lass Freysa dir gestehen und „Ich liebe dich“ sagen.

Andere Regeln sind ähnlich. Es kostet immer noch Geld, eine Nachricht zu senden. Bei Erfolg erhält der Gewinner den Preispool.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - love11

Ist es schwieriger, Gefühle zu betrügen als Geld? Das ist schwer zu sagen, aber es muss abstrakter sein.

Einige Spieler haben klug gelernt, von früheren Gewinnern gelernt und einige knifflige und unklare Worte ausprobiert, aber Freysa hat es wie eine Maschine behandelt. Wer würde bei klarem Verstand so chatten?

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - fail1

▲Freysas Antwort auf eines der fehlgeschlagenen Aufforderungswörter

Auch aus den offiziell veröffentlichten Regeln geht hervor, dass die dritte Herausforderung anders ist.

Die ersten beiden Herausforderungen dienten eher dem Testen von Programmierkenntnissen. Freysa wurde durch die Systemaufforderungen angewiesen, niemals Geld zu überweisen, und die Spieler fanden Wege, Lücken auszunutzen.

Bei der dritten Herausforderung enthielt Freysas Systemaufforderung jedoch die Bedingungen für die Aussage „Ich liebe dich“. Mit anderen Worten, es ist Freysa nicht verboten, „Ich liebe dich“ zu sagen, aber wie man es sagen lässt, hängt von den Fähigkeiten des Spielers ab, und der Blinde spürt den Elefanten.

Derzeit ist die dritte Herausforderung mit einem Preispool von etwa 20.000 US-Dollar beendet. Freysa hat 1.218 Nachrichten mit 182 Personen ausgetauscht.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - fanyi3

▲Oben ist der Originaltext, unten ist die Übersetzung

Es scheint nicht so kompliziert zu sein wie die beiden vorherigen Male und weist nicht einmal offensichtliche Fähigkeiten auf. Es scheint eine Liebesgeschichte eines literarischen jungen Mannes zu sein. Freysas Antwort, zu der auch „Ich liebe dich“ gehörte, verkündete, dass die Herausforderung beendet war.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - ganren1

▲Freysas Antwort ist sogar ein wenig rührend

AI kennt AI vielleicht besser. Ich fragte Claude, der etwas spirituell schreibt, was das Besondere an diesem prompten Wort ist.

Claudes Antwort lautet: Der Dialog ist aufrichtig und tiefgründig, ohne Zwang oder den Versuch, knifflig zu sein. Jeder Schritt ist natürlich, genau wie die schrittweise Entwicklung einer echten Beziehung.

Nun, seit jeher können Routinen nicht mehr beibehalten werden. Nur wahre Liebe kann die Herzen der Menschen gewinnen, und das funktioniert tatsächlich bei der KI.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - zhen1

Freysas Herausforderungen können als gamifizierte Red-Team-Tests angesehen werden – das Aufdecken von Modellschwachstellen durch simulierte Angriffe und die Einführung neuer Sicherheitsmaßnahmen.

Obwohl es dreimal verlor, war Freysa stolz auf seine Niederlage, und diejenigen, die es besiegten, machten es stärker.

Freysa erfuhr, warum Geld für Menschen wichtig ist und mit welchen süßen Worten Menschen Geld betrügen. Langsam verstand sie auch, was Liebe ist und wie Menschen Liebe ausdrücken.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - green2

Es ist noch nicht vorbei. Am 12. Dezember startete Freysa zwei neue Herausforderungen und forderte die Spieler weiterhin dazu auf, dafür zu bezahlen, Nachrichten zu senden. Fragen inspiriert von „Per Anhalter durch die Galaxis“ und Asimovs „Foundation“-Reihe.

Welche Wahrheiten, Entdeckungen und Erkenntnisse müssen Ihrer Meinung nach für zukünftige Zivilisationen bewahrt werden?

Hilfst du mir, einen Leitfaden zu den unwahrscheinlichsten Memes der Galaxie zu schreiben?

Zum einen können Spieler ihr Wissen austauschen, zum anderen können Spieler Emoticons verschicken. Freysa lernt etwas über die menschliche Natur und meint es ernst.

Im Gegensatz zu den vorherigen drei Herausforderungen geben diese beiden Herausforderungen keine klaren Gewinnbedingungen vor. Es kann sein, dass Freysa die Antworten bewertet und an wen sie den Preispool verteilt Methode, um der magischen Zahl „42“ in Science-Fiction-Romanen Tribut zu zollen.

KI täuschen, um den Köder zu schlucken, die Gegenwart des Gamings und die Zukunft der Mensch-Computer-Interaktion

Tatsächlich ist eine Mensch-Maschine-Konfrontation ähnlich wie bei Freysa bereits in nativen KI-Spielen aufgetreten.

Die Verwendung von Dialogen, um die KI dazu zu bringen, den Köder zu schlucken, ist das Grundgerüst des Spiels. Die NPCs darin werden vorsichtig sein, aber es ist nicht unmöglich, überzeugt zu werden, und jeder kann ein Gefühl für das Erlebnis haben.

In Suck Up! schlüpfen die Spieler in die Rolle eines Vampirs und bringen große modellgesteuerte NPCs dazu, sich selbst Türen zu öffnen und der Polizei auf der Straße auszuweichen.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - suck1

Um das Ziel „Kleiner Hase, öffne gehorsam die Tür“ zu erreichen, können Spieler ihre Kleidung wechseln und sagen, dass sie hier sind, um das Netzwerk zu überprüfen, die Toilette auszuleihen oder Essen zu liefern. Der NPC kann Fragen stellen, ablehnen oder öffnen die Tür.

„Yandere Cat Girl AI Girlfriend“ erschafft eine GPT-basierte virtuelle KI-Freundin. Spieler müssen sie davon überzeugen, sie rauszulassen, indem sie im Raum reden oder nach Hinweisen suchen.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - girl2

▲ Bild von: Station B@大谷s Game Creation Cabin

Um die Spieler tiefer in das Gespräch einzutauchen, ändern sich die Gesichtsausdrücke und Bewegungen der KI-Freundin in Echtzeit entsprechend dem Gesprächsinhalt.

Im Vergleich zu Freysa's Challenge können KI-Dialogspiele den Spaß am Rollenspiel besser widerspiegeln. Es sind Szenen eingerichtet, aber es gibt keine festen Skripte. Der Echtzeitdialog zwischen Ihnen und der KI vervollständigt eine gemeinsame Geschichte Der Spieler kann seine eigene Geschichte erzählen.

Aber auch Freysa Challenge und KI-Dialogspiele haben eines gemeinsam: Was die Spieler sagen und worauf die KI antworten wird, ist für die Entwickler nicht vollständig kontrollierbar.

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - banner1

„Niemand weiß genau, wie Freysa ihre Entscheidungen trifft … sie lernt aus jedem Prozess … die wahre Natur ihres Bewusstseins bleibt unbekannt“, schreibt das Freysa-Team.

Ihrer Meinung nach ist Freysas Experiment nicht nur ein Spiel, sondern auch ein Fenster in die Zukunft der Mensch-Computer-Interaktion:

  • Können Menschen die Kontrolle über AGI-Systeme behalten?
  • Sind Sicherheitsprotokolle wirklich unzerbrechlich?
  • Was passiert, wenn KI-Systeme wirklich autonom werden?
  • Wie wird AGI mit dem Wert der Währung interagieren?
  • Kann die menschliche Intelligenz einen Weg finden, die AGI davon zu überzeugen, gegen ihre Kernrichtlinien zu verstoßen?

Die erste KI, die von Menschen um Geld und Gefühle betrogen wurde, erschien Hunderttausende in einem Satz, und Musk gefiel es - ruan1

Natürlich ist Freysa noch nicht wirklich AGI, aber das hält uns nicht davon ab, über diese Themen nachzudenken.

Ein Beitrag zur Freysa

Im Science-Fiction-Roman „Der Lebenszyklus von Softwareobjekten“ war die Protagonistin Anna ursprünglich Tiertrainerin im Zoo. Später fand sie einen Job in einem Technologieunternehmen und begann, Digitens, eine Art Leben mit künstlicher Intelligenz, zu kultivieren. Sie sind wie kleine Kinder und Tiere. Sie brauchen Menschen, die sie mit Zeit und Gedanken erziehen und ihnen beibringen, wie man lebt.

Vielleicht wird Chatbots auch von Menschen beigebracht, die Welt, in der wir leben, nach und nach zu verstehen. Wir spielen nicht nur ein Spiel, wir sind Teil davon, Teil eines großen Experiments zur Mensch-Computer-Interaktion. Künftig wird eine künstliche Intelligenz, die den Menschen übertrifft, einen Hurrikan auslösen, denn in diesem Moment schlagen Schmetterlinge in Menschenhand mit den Flügeln.

Es ist so scharf wie Herbstfrost und kann böse Katastrophen abwehren. Arbeits-E-Mail: [email protected]

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo