Chatbots gehen mit ChatGPT Gov nach Washington

Januar 30, 2025 Eskere Guru

Brille und Chatgpt — Matheus Bertelli / Pexels

In einem X-Beitrag am Montag, in dem er den plötzlichen Erfolg von DeepSeek kommentierte, versprach OpenAI-CEO Sam Altman, „einige Veröffentlichungen vorzunehmen“, und es scheint, dass er dies auch getan hat. OpenAI stellte am Dienstag sein neuestes Produkt vor, eine „maßgeschneiderte Version von ChatGPT, die US-Regierungsbehörden eine zusätzliche Möglichkeit bieten soll, auf die Grenzmodelle von OpenAI zuzugreifen“, heißt es in der Ankündigung . Berichten zufolge wird ChatGPT Gov noch strengere Datensicherheitsmaßnahmen anbieten als ChatGPT Enterprise, aber wie wird es mit den Halluzinationen umgehen, die die anderen Modelle des Unternehmens plagen?

Laut OpenAI haben mehr als 90.000 Mitarbeiter der Bundes-, Landes- und Kommunalverwaltung in 3.500 Behörden ChatGPT seit Anfang 2024 mehr als 18 Millionen Mal abgefragt. Die neue Plattform wird es Regierungsbehörden ermöglichen, „nicht öffentliche, sensible Informationen“ einzugeben ChatGPT, während es in ihren sicheren Hosting-Umgebungen läuft – insbesondere in der kommerziellen Microsoft Azure-Cloud oder der Azure Government Community Cloud – und in Cybersicherheits-Frameworks wie IL5 oder CJIS. Dies ermöglicht es jeder Behörde, „ihre eigenen Sicherheits-, Datenschutz- und Compliance-Anforderungen zu verwalten“, sagte Felipe Millon, Government Sales Lead bei OpenAI, gegenüber Reportern in der Pressekonferenz am Dienstag.

Deepseeks R1 ist ein beeindruckendes Modell, insbesondere was das Preis-Leistungs-Verhältnis betrifft.
Natürlich werden wir viel bessere Modelle liefern und es ist wirklich belebend, einen neuen Konkurrenten zu haben! Wir werden einige Veröffentlichungen veröffentlichen.
– Sam Altman (@sama) 28. Januar 2025

Das Unternehmen demonstrierte während des Pressegesprächs auch, was ChatGPT Gov tun kann, das auf dem GPT-4o -Modell läuft. In der Demo meldete sich ein „Bundesangestellter“ bei ChatGPT an, erstellte einen Fünf-Wochen-Plan für seine beruflichen Aufgaben und analysierte dann eine gedruckte Version desselben Fünf-Wochen-Plans, versehen mit handbeschrifteten Notizen und Ergänzungen. Anschließend verfasste ChatGPT ein Memo an die Rechts- und Compliance-Abteilung der Agentur, in dem es seinen Plan zusammenfasste.

„Ich weiß, dass Präsident Trump auch darüber nachdenkt, wie wir das möglicherweise rationalisieren können, denn es ist eine Möglichkeit, modernere Software-Tools in die Regierung zu bringen und ihr dabei zu helfen, effizienter zu arbeiten“, sagte Kevin Weil, CPO von OpenAI, gegenüber CNBC. „Deshalb sind wir sehr gespannt darauf.“

ChatGPT Gov basiert weitgehend auf dem bestehenden ChatGPT Enterprise- Framework, das noch das Federal Risk and Authorization Management Program durchläuft und noch nicht für den Umgang mit nicht öffentlichen Daten freigegeben wurde. Es gibt noch keinen Zeitplan dafür, wann diese Akkreditierung erfolgen könnte, aber die KI wird wahrscheinlich nicht vor diesem Zeitpunkt für die tatsächlichen Mitarbeiter der Agentur bereitgestellt.

Auch wenn der Fokus auf Daten und Betriebssicherheit liegt, stellt der Einsatz generativer KI für so lebenswichtige und sensible Aufgaben wie das Funktionieren der Regierung einzigartige und schwierige Herausforderungen dar. Wir haben bereits mehr als einen Anwalt dabei erwischt, wie er Chatbots nutzte, um „ Recherchen durchzuführen “, was dazu führte, dass er sich auf halluzinierte Rechtsprechung berief, und dass sich die Polizei auf fehlerhafte KI-basierte Beweise stützte, um Menschen unrechtmäßig zu verhaften . Die kalifornischen Wähler lehnten kürzlich auch eine Maßnahme ab , die KI für die Verhängung von Kautionsverurteilungen verantwortlich gemacht hätte.

Darüber hinaus ergab eine Stanford HAI-Studie aus dem Jahr 2024, dass populäre Rechtsmodelle von Thomas Reuters und LexisNexis, die „halluzinationsfreie Rechtsforschung“ versprechen, in ihren Antworten tatsächlich halluzinierten, und zwar in 34 % bzw. 17 % der Fälle. Die Autoren der Studie weisen darauf hin, dass dies immer noch eine deutliche Verbesserung gegenüber Allzweck-Chatbots darstellt, die in 58 % bis 82 % der Fälle halluzinierte Antworten auf rechtliche Anfragen lieferten .

Die Ankündigung von OpenAI erfolgte nur wenige Stunden, nachdem DeepSeek V3 vorgestellt hatte , sein neuestes generatives Modell, das eine vergleichbare Leistung wie das hochmoderne o1-Argumentationsmodell von OpenAI bietet und dabei je nach Aufgabe 20 bis 50 Mal weniger Strom verbraucht. Das chinesische Startup hat mit dieser Enthüllung die amerikanische KI-Branche in Unordnung gebracht und die Notwendigkeit in Frage gestellt, immer mehr Rechenzentren und Kraftwerke zu bauen, wenn effizienterer KI-Code dasselbe erreichen könnte. Nvidia, der weltweit führende Anbieter von GPUs, den spezialisierten Verarbeitungseinheiten, die KI-Systeme für Trainings- und Inferenzaufgaben benötigen, verlor als Reaktion auf die DeepSeek-Nachrichten 600 Milliarden US-Dollar an Marktkapitalisierung . Auch die Aktienwerte von Gas- und Kernenergieunternehmen sanken.