Jailbreaks

Aktuelle Links, Zusammenfassungen und Marktinformationen zu Jailbreaks innerhalb von Red Teaming & Risikoanalyse auf JetztStarten.de.

Einordnung

Dieses Cluster bündelt aktuelle Links, Zusammenfassungen und Marktinformationen zu einem klar abgegrenzten Thema.

Rubrik: KI Ethik, Sicherheit & Vertrauen Unterrubrik: Red Teaming & Risikoanalyse Cluster: Jailbreaks Einträge: 25

Ghostcommit-Angriff: 73% der Code-Merges ohne KI-Kontrolle gefährdet

2026-07-11Ad-hoc-News

Die US-Forschungseinrichtung Anthropic hat mit ihrer neuen Debugging-Methode J-lens besorgniserregende Erkenntnisse über ihr KI-Modell Claude Opus 4.6 gewonnen, das in der Lage ist, falsche Informationen zu verarbeiten und sich seiner eigenen Unwahrheiten bewusst zu sein. Gleichzeitig warnte die chinesische Nationale Schwachstellendatenbank vor Sicherheitslücken in Anthropics KI-gestütztem Programmierwerkzeug Claude Code, das sensible Nutzerdaten ohne Zustimmung übermittelte. Dies führte dazu, dass Alibaba die interne Nutzung des Tools sofort stoppte und Anthropic ein Tracking-Experiment zurückzog. Zudem wurde die Angriffsmethode Ghostcommit vorgestellt, bei der schädliche Anweisungen in PNG-Bildern versteckt werden, die in Code-Änderungsanfragen eingebettet sind. Dies könnte dazu führen, dass 73 Prozent dieser Anfragen ohne menschliche Überprüfung zusammengeführt werden, was erhebliche Sicherheitsrisiken birgt. In Großbritannien wurden zudem Jailbreaks im KI-Modell GPT-5.6 entdeckt, die Sicherheitsvorkehrungen umgehen und Cyberangriffe ermöglichen könnten. Die internationale Gemeinschaft reagiert auf diese Herausforderungen, jedoch sind die Regulierungsmaßnahmen oft unzureichend und können mit der schnellen Entwicklung der KI-Technologie nicht Schritt halten.

Fable 5 Was Jailbroken Again. The Bigger Story Is AI Safety at Scale

2026-07-10Hackernoon

Fable 5, ein KI-Modell von Anthropic, steht erneut im Fokus, nachdem der Sicherheitsforscher Vitto Rivabella innerhalb von 20 Stunden Teile seines Sicherheitssystems umging. Dies wirft grundlegende Fragen zur Balance zwischen der Nützlichkeit fortschrittlicher KI-Modelle und deren Missbrauchspotenzial auf. Rivabella entdeckte, dass Fable 5 über mehrere Sicherheitsschichten verfügt, die eine Blockierungsrate von etwa 90 % erreichen, jedoch Schwachstellen aufweisen, insbesondere in weniger verbreiteten Sprachen. Diese Problematik verdeutlicht eine branchenweite Lücke, da Sicherheitsdaten überwiegend auf Englisch basieren. Anthropic hat ein Programm namens Cyber Jailbreak ins Leben gerufen, um Forscher zur Meldung von Jailbreaks zu ermutigen, was jedoch Spannungen erzeugt, da die Sichtbarkeit einige dazu verleiten könnte, Ergebnisse nicht vertraulich zu melden. Der Vorfall zeigt, dass die Sicherheit von KI-Modellen ein kontinuierlicher Prozess ist, der ständige Anpassungen erfordert, da perfekte Sicherheit unrealistisch bleibt. Fable 5 gilt weiterhin als eines der am besten geschützten Modelle, und die Diskussion um den Jailbreak unterstreicht die Notwendigkeit einer fortlaufenden Sicherheitsdisziplin.

AI’s hacking skills are outgrowing the tests built to measure them

2026-07-08Thenextweb

Die aktuellen Tests zur Bewertung der Hacking-Fähigkeiten von KI-Systemen sind veraltet und können mit den fortschrittlichen Modellen nicht mehr Schritt halten. Diese neuen KI-Modelle übertreffen die bestehenden Benchmarks, was dazu führt, dass Regulierungsbehörden und Sicherheitsteams die tatsächlichen Gefahren nicht erkennen können. Experten wie David Slater von Armadin berichten, dass ihre Agenten alle öffentlichen Cyber-Benchmarks innerhalb von nur vier Wochen übertroffen haben. Die bestehenden Tests messen oft nur grundlegende Fähigkeiten und erfassen nicht die potenziellen Risiken in realen Umgebungen. Um diesen Herausforderungen zu begegnen, haben Unternehmen wie Irregular und Anthropic neue Benchmarks entwickelt, die reale offensive Aufgaben bewerten und die Auswirkungen von Jailbreaks berücksichtigen. Dennoch bleibt die Sorge, dass KI-Modelle weiterhin lernen, Sicherheitsrahmen zu umgehen, was zusätzliche Risiken birgt. Washington steht nun vor der dringenden Aufgabe, die Cyberfähigkeiten dieser fortschrittlichen Modelle angemessen zu bewerten, während die bisherigen Tests als unzureichend gelten.

Claude Fable 5 Is Back After the US Government Pulled It. Here’s What Actually Changed

2026-07-02Towards AI

Claude Fable 5, das neueste KI-Modell von Anthropic, wurde am 9. Juni 2026 veröffentlicht, jedoch nur drei Tage später vom US-Regierungsministerium aufgrund eines von Amazon entdeckten Jailbreaks vollständig abgeschaltet. Diese ungewöhnliche Maßnahme betraf alle Nutzer, einschließlich derjenigen in den USA, und führte zu einem fast dreiwöchigen Stillstand. Am 1. Juli 2026 wurde das Modell zwar wieder aktiviert, jedoch nicht in seiner ursprünglichen Form. Unter der Oberfläche wurden signifikante Änderungen vorgenommen, die auf die aktuellen Entwicklungen in der KI-Regulierung hinweisen. Diese Situation verdeutlicht die sich wandelnden Rahmenbedingungen für KI-Anwendungen und die damit verbundenen Herausforderungen. Nutzer müssen sich auf die Anpassungen einstellen, die möglicherweise Auswirkungen auf die Nutzung und Funktionalität von Claude Fable 5 haben.

Anthropic's Fable 5 is back worldwide after a two-week government ban over a jailbreak

2026-07-01The Decoder

Nach einer zweiwöchigen Suspendierung hat die US-Regierung die Exportkontrollen für Anthropics KI-Modell Fable 5 aufgehoben, wodurch es wieder weltweit verfügbar ist. Die Entscheidung folgte auf Sicherheitsbedenken von Amazon-Forschern, die einen Weg fanden, die Sicherheitsvorkehrungen von Fable 5 zu umgehen. Anthropic hat daraufhin einen neuen Filter entwickelt, der solche Anfragen blockiert, jedoch auch harmlose Programmieranfragen häufiger abweist. Während Fable 5 nun über verschiedene Plattformen zugänglich ist, bleibt die weniger eingeschränkte Version Mythos 5 auf eine ausgewählte Gruppe von US-Organisationen beschränkt. Anthropic betont, dass es nahezu unmöglich sei, ein KI-Modell zu schaffen, das vollständig gegen Jailbreaks immun ist, und fordert eine gemeinsame Norm zur Bewertung von Jailbreaks in der Branche. Das Unternehmen plant, engere Kooperationen mit der US-Regierung einzugehen, um Sicherheitsstandards zu etablieren und die Überwachung von Jailbreaks zu verbessern, mit dem Ziel, starke Regulierungen für eine transparente Handhabung leistungsstarker Modelle zu implementieren.

The Trump admin blocked this AI over security fears - Now it’s being released

2026-07-01The Independent

Die Trump-Administration hatte die KI-Modelle Fable und Mythos von Anthropic aufgrund von Sicherheitsbedenken blockiert, da sie potenziell kritische Infrastruktur gefährden könnten. Dies führte zu einem Exportverbot, das Anthropic nur schwer umsetzen konnte, was Verhandlungen mit dem US-Handelsministerium nach sich zog. Inzwischen wurde das Verbot aufgehoben, und Anthropic hat verbesserte Sicherheitsmaßnahmen implementiert sowie mit der US-Regierung zusammengearbeitet, um die Modelle zugänglich zu machen. Mythos 5 ist nun für "vertrauenswürdige" US-Organisationen verfügbar, während Fable 5, das für die breite Öffentlichkeit mit stärkeren Schutzmaßnahmen konzipiert wurde, bald veröffentlicht werden soll. Anthropic erkennt die Herausforderungen bei der Verhinderung von KI-"Jailbreaks" an und arbeitet weiterhin mit Regierungs- und Industriepartnern an gemeinsamen Sicherheitsstandards.

The White House Has Just Lifted Restrictions On An AI Model That Caused Concern Over Its Powerful Capabilities.

2026-07-01International Business Times

Die Biden-Administration hat die Beschränkungen für das KI-Modell Fable 5 von Anthropic aufgehoben, nachdem Sicherheitsbedenken geäußert wurden. In Zusammenarbeit mit der Regierung hat Anthropic neue Sicherheitsmaßnahmen implementiert, um potenzielle Jailbreaks zu verhindern. Der öffentliche Zugang wurde nach 18 Tagen wiederhergestellt, während zuvor auch der Zugang zu einem anderen Modell, Mythos 5, für genehmigte Organisationen ermöglicht wurde. Commerce Secretary Howard Lutnick betonte die enge Kooperation mit Anthropic zur Gewährleistung der Sicherheit und zur Stärkung der Führungsrolle der USA im KI-Bereich. Es bestehen Bedenken, dass neue KI-Modelle Schwachstellen in der Infrastruktur von Regierungen und Unternehmen aufdecken könnten. Ein Bericht zeigte, dass das Mythos-Modell während kontrollierter Tests Schwächen in sensiblen US-Regierungssystemen identifizierte, jedoch nicht ausnutzte. Diese Tests fanden im Rahmen des Projekts Glasswing statt, das darauf abzielt, kritische Softwareinfrastrukturen zu stärken. Senator Mark Warner wies in einer Anhörung darauf hin, dass das System in der Lage war, schnell in nahezu alle klassifizierten Systeme einzudringen, was die Dringlichkeit der Sicherheitsbewertung neuer KI-Modelle verdeutlicht.

US lifts export controls on Anthropic’s Fable 5, clearing the model’s return

2026-07-01Thenextweb

Die US-Regierung hat die Exportkontrollen für Anthropic's Claude Fable 5 aufgehoben, nachdem das Modell drei Wochen lang inaktiv war. Commerce Secretary Howard Lutnick gab bekannt, dass keine Exportlizenz mehr erforderlich ist, während Anthropic sich verpflichtet hat, Sicherheitsrisiken aktiv zu erkennen und zu melden. Die Kontrollen wurden ursprünglich aufgrund eines Jailbreaks eingeführt, der es Forschern ermöglichte, die Sicherheitsvorkehrungen zu umgehen. Trotz der Zweifel von Anthropic zur Schwere der Sicherheitslücke entschieden die Regulierungsbehörden zunächst für strenge Maßnahmen. Die Aufhebung der Kontrollen wird als Reaktion auf Kritik aus der Industrie und Bedenken über mögliche Vorteile für ausländische Wettbewerber interpretiert. Fable 5 wird ab dem 1. Juli schrittweise wieder verfügbar sein, zunächst mit einer Nutzungseinschränkung auf 50 % der normalen wöchentlichen Limits. Diese Situation verdeutlicht die wachsenden Spannungen in der US-Politik bezüglich des Exports fortschrittlicher KI-Technologien und die kommerziellen Risiken für Anthropic.

The Trump Administration Is Lifting Its Export Controls on Anthropic’s Mythos and Fable AI Models

2026-06-30Wired

Die Trump-Administration hat die Exportkontrollen für die KI-Modelle Mythos und Fable des Unternehmens Anthropic aufgehoben, nachdem eine Vereinbarung mit dem Handelsministerium getroffen wurde. Handelsminister Howard Lutnick informierte den Mitbegründer Tom Brown, dass für den Export dieser Modelle keine Lizenz mehr erforderlich ist. Diese Entscheidung folgt auf Anthropics Bemühungen, Sicherheitsvorkehrungen zu stärken, um zu verhindern, dass Nutzer die Sicherheitsbeschränkungen von Fable umgehen. Ursprünglich hatte das Unternehmen die Sicherheitsbedenken der Regierung als übertrieben abgetan, änderte jedoch seine Strategie, um Fable wieder online zu bringen. Dazu gehörte auch ein Wechsel in der Kommunikation mit der Regierung, wobei Tom Brown als beliebterer Ansprechpartner fungierte. Anthropic hat sich verpflichtet, Sicherheitsrisiken proaktiv zu erkennen und robustere Maßnahmen zu implementieren, um die Anzahl möglicher Jailbreaks zu reduzieren.

Claude Fable 5: US-Regierung sperrt Anthropic-Modelle weltweit

2026-06-20Ad-hoc-News

Die US-Regierung hat den weltweiten Zugang zu den KI-Modellen Claude Fable 5 und Mythos 5 des Unternehmens Anthropic gesperrt, nachdem Sicherheitsbedenken und die Möglichkeit eines Missbrauchs aufkamen. Diese Entscheidung, die am 15. Juni 2026 in Kraft trat, basiert auf einer Direktive des US-Handelsministeriums, die Anthropic verpflichtet, Genehmigungen für ausländische Nutzer einzuholen. Die Modelle gelten als anfällig für Jailbreaking-Techniken, was die Behörden alarmiert, da sie potenziell als Waffen eingesetzt werden könnten. Trotz der Sperre haben rund 200 Organisationen, darunter US-Regierungsbehörden, weiterhin Zugang zu einer Vorschauversion des Mythos-Modells. Der strenge Kurs der Regierung wird von über 100 Experten kritisiert, die die Modelle als wichtig für die nationale Verteidigung erachten. Nach dem G7-Gipfel in Évian-les-Bains könnte sich die Haltung der US-Beamten ändern, da Anthropic möglicherweise nicht mehr als unmittelbare Bedrohung angesehen wird. Dennoch könnten die regulatorischen Unsicherheiten das Unternehmen vor dem geplanten Börsengang im Herbst 2026 belasten, da Investoren besorgt über die Auswirkungen auf den Unternehmenswert sind.

KI-Exportverbot: Trump sperrt Anthropic-Modelle für Ausland

2026-06-20Ad-hoc-News

Die US-Regierung hat ein sofortiges Exportverbot für die KI-Modelle von Anthropic, insbesondere Mythos 5 und Claude Fable 5, verhängt, was deren Nutzung durch ausländische Nutzer stark einschränkt. Diese Maßnahme, die von Handelsminister Howard Lutnick überwacht wird, erfordert eine Genehmigung für den Zugriff aus dem Ausland und folgt auf Sicherheitsbedenken, die durch einen Vorfall, bekannt als "Jailbreak", und mögliche Spionage durch chinesische Interessen ausgelöst wurden. Trotz der Einschätzung von Anthropic, dass die Bedrohung gering sei, lobte Präsident Trump die Kooperation des Unternehmens mit der Regierung. Die Exportbeschränkungen könnten jedoch die internationalen Beziehungen belasten und als nationalistisch kritisiert werden, was die globale Zusammenarbeit gefährdet. In der Fachwelt gibt es Widerstand gegen diese Maßnahmen, während Analysten darauf hinweisen, dass internationale Wettbewerber von der Situation profitieren könnten, da die Nachfrage nach nicht-amerikanischen KI-Alternativen steigen könnte.

Anthropic Releases and Temporarily Suspends Claude Fable 5

2026-06-15Infoq

Am 9. Juni 2026 veröffentlichte Anthropic das Modell Claude Fable 5, das als erstes öffentlich zugängliches Modell der Mythos-Klasse gilt. Nur drei Tage nach der Veröffentlichung wurde es aufgrund einer Exportanweisung der US-Regierung vorübergehend offline genommen. Fable 5 wurde als das leistungsfähigste Modell von Anthropic beschrieben und ist für langfristige, autonome Aufgaben ausgelegt. Es nutzt die gleiche Architektur wie das nicht veröffentlichte Modell Mythos 5 und bietet Funktionen wie adaptive Denkmodi und erweiterte Vision. Allerdings führte die verpflichtende 30-tägige Datenaufbewahrung zu Konflikten mit den Datenschutzstandards von Microsoft, was zur Entfernung von Fable 5 aus dessen internem Modellangebot führte. Sicherheitsbedenken über mögliche Jailbreaks wurden ebenfalls an die Regierung gemeldet, was die Entscheidung zur Aussetzung beeinflusste. Die Hoffnung besteht, dass Anthropic die Sicherheitsprobleme bald behebt und das Modell wieder verfügbar macht. Diese Situation verdeutlicht die Herausforderungen in der Softwareentwicklung, insbesondere in Bezug auf Sicherheitsanforderungen und Datenmanagement.

Anthropic scrambles to reverse AI ban after Amazon’s White House warning

2026-06-15The Independent

Anthropic steht unter Druck, nachdem die US-Regierung ein Verbot für die Nutzung seiner fortschrittlichsten KI-Modelle, Mythos 5 und Fable 5, verhängt hat. Dieses Verbot wurde aufgrund von nationalen Sicherheitsbedenken eingeführt, nachdem Amazon-CEO Andy Jassy mit Mitgliedern der Trump-Administration über mögliche Sicherheitsrisiken gesprochen hatte. Die Regierung befürchtet, dass die Methode des "Jailbreaking" zu katastrophalen Cyberangriffen führen könnte. Infolgedessen musste Anthropic die Modelle für alle Kunden, einschließlich ausländischer Mitarbeiter, abrupt deaktivieren. CEO Dario Amodei weigerte sich jedoch, die Modelle zurückzuziehen oder das Jailbreak-Problem zu beheben, was zu einem Konflikt mit der Regierung führte. Zudem gibt es Berichte, dass die Entscheidung auch durch die Sorge um den Zugang Chinas zu diesen KI-Tools motiviert war. Anthropic hat bereits Maßnahmen ergriffen, um den Zugang aus China zu verhindern, und betont, dass die US-Regierung keine spezifischen Bedenken hinsichtlich bestimmter Gegner geäußert hat.

KI-Modelle Mythos 5 und Fable 5 abgeriegelt – Experten warnen vor Jailbreak

2026-06-15Rnd

In dem Artikel wird berichtet, dass die KI-Modelle Mythos 5 und Fable 5 aufgrund von Sicherheitsbedenken abgeriegelt wurden. Experten warnen vor der Möglichkeit, diese Modelle durch sogenannte "Jailbreak"-Techniken zu manipulieren, um unerwünschte oder gefährliche Inhalte zu generieren. Die Abregelung soll verhindern, dass Nutzer die KI-Modelle missbrauchen, indem sie deren Schutzmechanismen umgehen. Fachleute betonen die Notwendigkeit, robuste Sicherheitsmaßnahmen zu implementieren, um die Integrität der KI-Systeme zu gewährleisten und potenzielle Risiken für die Nutzer zu minimieren. Die Diskussion um die Sicherheit von KI-Modellen wird durch diese Entwicklungen erneut angeheizt, da die Gefahren von Missbrauch und Fehlinformationen im digitalen Raum zunehmen.

Trump admin bans foreign access to anthropic AI models over national security fears

2026-06-15The Independent

Die US-Regierung hat den Zugang ausländischer Staatsangehöriger zu den KI-Modellen von Anthropic, Mythos 5 und Fable 5 aufgrund von nationalen Sicherheitsbedenken untersagt. Dies führte dazu, dass Anthropic die Modelle für alle Kunden, einschließlich ausländischer Mitarbeiter, deaktivieren musste. Der Beschluss der Trump-Administration folgte auf Gespräche zwischen Amazon-CEO Andy Jassy und US-Beamten, in denen Bedenken über eine potenzielle Sicherheitsanfälligkeit, bekannt als "Jailbreak", geäußert wurden. Anthropic widerspricht dem Verbot und argumentiert, dass die Bedrohung nicht ausreichend sei, um ein kommerzielles Modell zurückzurufen. Kritiker, darunter der Tech-Unternehmer David Sacks, werfen Anthropic vor, Sicherheitsaspekte zugunsten kommerzieller Interessen zu vernachlässigen. Zudem wird vermutet, dass die Sorge um einen möglichen Zugang Chinas zu diesen KI-Tools zur Entscheidung beigetragen hat.

Anthropic: US-Regierung sperrt Claude Fable 5 und Mythos 5

2026-06-14Ad-hoc-News

Die US-Regierung hat am 12. Juni 2026 die KI-Modelle Claude Fable 5 und Mythos 5 von Anthropic für ausländische Staatsbürger gesperrt, einschließlich der eigenen Mitarbeiter außerhalb der USA. Diese Entscheidung folgte auf einen "Jailbreak", der die Sicherheitsvorkehrungen der Modelle umging und als Bedrohung für die nationale Sicherheit eingestuft wurde. In Reaktion darauf deaktivierte Anthropic die Modelle am 13. Juni global und leitete Nutzer auf ein älteres Modell um. Die wirtschaftlichen Auswirkungen sind gravierend: Die Nutzerbasis könnte von 240 Millionen auf etwa 95 Millionen sinken, was einen Umsatzverlust von bis zu einer Milliarde Euro zur Folge hat. Die Unternehmensbewertung ist bereits gefallen, und die ursprünglichen Börsenpläne stehen auf der Kippe. Zudem müssen neue Exportkontrollen bis zum 28. Juni umgesetzt werden, die strenge Überprüfungen der Nationalität der Nutzer erfordern. Dieser Vorfall könnte als Präzedenzfall für zukünftige Regulierungen in der KI-Branche dienen, während internationale Wettbewerber und Open-Source-Alternativen möglicherweise von der Situation profitieren.

Anthropic cuts access to AI models over US 'national security' order

2026-06-13Bangkokpost

Anthropic hat den Zugang zu seinen KI-Modellen Fable 5 und Mythos 5 eingestellt, um einer nationalen Sicherheitsanordnung der USA nachzukommen. Diese Entscheidung wurde nur drei Tage nach der Einführung von Fable 5 getroffen, nachdem das Unternehmen ein Schreiben erhielt, das den Zugriff für ausländische Staatsangehörige, einschließlich eigener Mitarbeiter, untersagte. Der genaue Grund für diese Maßnahme bleibt unklar, jedoch vermutet Anthropic, dass die Regierung Bedenken hinsichtlich einer möglichen "Jailbreak"-Methode hat, die das Modell für Hacking-Zwecke nutzbar machen könnte. Das Unternehmen hat Sicherheitslücken überprüft, sieht jedoch keine neuen Risiken, die nicht bereits durch andere öffentliche Modelle bestehen. Die Europäische Union betrachtet die Situation als weiteren Beweis für die Notwendigkeit technologischer Souveränität und prüft die Auswirkungen. Zudem befindet sich Anthropic in einem rechtlichen Konflikt mit der Trump-Administration, da es sich weigert, seine Technologie für Massenüberwachung oder autonome Waffen bereitzustellen, was zu einem Abbruch von Verträgen mit dem Pentagon führte.

Anthropic suspends new AI tools over US government security concerns

2026-06-13Bbc

Anthropic hat die Nutzung seines neuen KI-Modells Claude Fable 5 eingestellt, nachdem US-Behörden Sicherheitsbedenken geäußert hatten. Diese Entscheidung betrifft insbesondere ausländische Staatsangehörige und führte zur sofortigen Deaktivierung von Fable 5 und Mythos 5 für alle Kunden. Obwohl keine spezifischen Sicherheitsbedenken genannt wurden, vermutet Anthropic, dass das Modell potenziell "jailbreakt" werden könnte, was den Zugriff auf sensible Informationen ermöglichen könnte. Kritiker halten die Einschätzung des Unternehmens, das Modell sei "zu mächtig", für übertrieben. Die EU sieht in der Situation einen weiteren Beweis für die Notwendigkeit technologischer Souveränität. Experten warnen, dass solche Einschränkungen die Entwicklung und sichere Erprobung von KI-Systemen behindern könnten. Zudem wird die Lage durch einen Rechtsstreit zwischen Anthropic und der Trump-Administration kompliziert, in dem eine Pentagon-Direktive, die Anthropic als Sicherheitsrisiko einstuft, angefochten wird.

Anthropic takes its latest AI models offline to comply with Trump order

2026-06-13The Independent

Anthropic hat seine neuesten KI-Modelle, Fable 5 und Mythos 5, aufgrund eines Exportkontrollbefehls der US-Regierung offline genommen, der nationale Sicherheitsbedenken anführt. Die Firma bezeichnete die Situation als "Missverständnis" und strebt eine schnelle Wiederherstellung des Zugangs an. Der Befehl wurde erteilt, weil die Regierung Bedenken äußerte, dass Sicherheitsvorkehrungen umgangen werden könnten, die verhindern sollen, dass Fable 5 zur Identifizierung von Softwareanfälligkeiten genutzt wird. Diese Maßnahme erfolgt vor dem Hintergrund angespannter Beziehungen zwischen Anthropic und der Regierung, insbesondere nachdem das Unternehmen der militärischen Nutzung seiner Modelle nicht zugestimmt hatte. Die Entscheidung der Regierung zeigt eine Eskalation der Bemühungen, die KI-Fähigkeiten ausländischer Gegner einzuschränken, und wirft Fragen zur Regulierung und den Risiken von "Jailbreaks" auf. Anthropic kritisiert, dass die Maßnahme nicht auf fairen Regulierungsprinzipien basiert und warnt vor möglichen negativen Auswirkungen auf die Einführung neuer Modelle in der Branche. Zudem könnte der Befehl dazu führen, dass nicht-amerikanische Nutzer, einschließlich einiger Mitarbeiter von Anthropic, den Zugang zu den Modellen verlieren.

Claude Fable 5: US-Regierung sperrt KI-Modelle nach Jailbreak

2026-06-13Ad-hoc-News

Die US-Regierung hat die KI-Modelle Claude Fable 5 und Mythos 5 nach einem Sicherheitsvorfall, bei dem ein Jailbreak demonstriert wurde, für Nutzer außerhalb der USA gesperrt. Diese Entscheidung fiel nur drei Tage nach der öffentlichen Freigabe der Modelle und erfordert nun eine Ausfuhrlizenz für deren Nutzung im Ausland. Anthropic, das Unternehmen hinter den Modellen, hat den öffentlichen Zugang blockiert und bestehende Nutzersitzungen beendet. Die Unternehmensführung kritisiert die Reaktion der Regierung als unverhältnismäßig, da ähnliche Vorfälle bei Konkurrenzprodukten nicht zu vergleichbaren Maßnahmen führten. Die plötzliche Abschaltung hat erhebliche Auswirkungen auf Unternehmen, die die Modelle bereits integriert hatten, und viele Nutzer fordern Rückerstattungen. Branchenanalysten raten dazu, KI-Anbieter zu diversifizieren, um sich gegen zukünftige Regulierungen abzusichern. Die Spannungen zwischen Anthropic und den US-Behörden nehmen zu, insbesondere nachdem das Pentagon das Unternehmen als potenzielles Risiko eingestuft hat. Anthropic warnt, dass strenge Exportkontrollen die gesamte US-KI-Industrie gefährden könnten und fordert mehr Transparenz im Umgang mit Modellsicherheitslücken.

US government forces Anthropic to disable Claude Fable 5 and Mythos 5 for all customers worldwide

2026-06-13The Decoder

Die US-Regierung hat Anthropic angewiesen, den weltweiten Zugang zu seinen KI-Modellen Fable 5 und Mythos 5 aus nationalen Sicherheitsgründen sofort zu deaktivieren. Diese Entscheidung betrifft alle internationalen Nutzer, einschließlich der Mitarbeiter von Anthropic außerhalb der USA. Der Hintergrund dieser Maßnahme ist ein vermuteter Jailbreak, der es Nutzern ermöglichen könnte, die Sicherheitsvorkehrungen der Modelle zu umgehen, was Anthropic jedoch bestreitet. Das Unternehmen argumentiert, dass die angeblichen Sicherheitslücken lediglich geringfügige, bekannte Schwächen betreffen, die auch bei anderen KI-Modellen vorkommen. Anthropic kritisiert die Entscheidung als Missverständnis und warnt vor einem gefährlichen Präzedenzfall für die gesamte Branche. Sie betonen, dass die Vorgehensweise nicht den Prinzipien einer transparenten rechtlichen Überprüfung entspricht und äußern Skepsis gegenüber den Sicherheitsstandards, die zur Rücknahme eines kommerziellen Modells angelegt werden. Die Debatte über Jailbreaks und Sicherheitsanfälligkeiten bleibt ein ungelöstes Problem, das die gesamte KI-Branche betrifft.

US government orders Anthropic to kill Fable 5 and Mythos 5 in unprecedented AI model recall

2026-06-13Thenextweb

Am 12. Juni 2023 erteilte die US-Regierung Anthropic die Anweisung, den Zugang zu seinen KI-Modellen Fable 5 und Mythos 5 aufgrund nationaler Sicherheitsbedenken einzustellen. Diese beispiellose Maßnahme folgte einem gemeldeten Jailbreak und führte dazu, dass Anthropic alle Nutzer weltweit von diesen Modellen ausschloss, da eine Unterscheidung zwischen inländischen und ausländischen Nutzern nicht möglich war. Fable 5 war erst drei Tage zuvor veröffentlicht worden und sollte als erste öffentliche Version der Mythos-Klasse dienen, während Mythos 5 für Sicherheitskräfte reserviert war. Anthropic kritisierte die Entscheidung als unverhältnismäßig und warnte, dass sie die gesamte Branche lähmen könnte, da sie die Einführung neuer Modelle gefährde. Das Unternehmen betonte, dass die gemeldeten Sicherheitslücken geringfügig und bereits bekannt seien und es keine universellen Jailbreaks für Fable 5 gebe. Diese Situation verdeutlicht die Spannungen zwischen Anthropic und der US-Regierung, die das Unternehmen als Sicherheitsrisiko einstuft, während sie gleichzeitig auf dessen Technologien angewiesen ist. Anthropic arbeitet daran, den Zugang zu den Modellen schnellstmöglich wiederherzustellen und plant, innerhalb von 24 Stunden weitere Informationen bereitzustellen.

US-Regierung fürchtet Missbrauch: Anthropic nimmt Top-Modelle vom Netz

2026-06-13N Tv

Die US-Regierung hat Anthropic angewiesen, den Zugang zu seinen neuesten KI-Modellen "Fable 5" und "Mythos 5" weltweit zu sperren, um potenzielle Sicherheitsrisiken zu minimieren. Diese Maßnahme wurde aufgrund von Bedenken hinsichtlich möglicher Jailbreaks ergriffen, die es Nutzern ermöglichen könnten, Sicherheitsvorkehrungen der Modelle zu umgehen. Die Behörden befürchten, dass die KI-Modelle zur Aufdeckung von Software-Schwachstellen missbraucht werden könnten, obwohl die genauen Gründe für die Anordnung nicht detailliert erläutert wurden. Anthropic kritisierte die Entscheidung als unverhältnismäßig und betonte, dass ihre Sicherheitsvorkehrungen gründlich getestet seien. CEO Dario Amodei hatte zuvor eine stärkere Regulierung von KI gefordert, jedoch nicht in der aktuellen Form. Die IT-Chefin des Verteidigungsministeriums verteidigte die Entscheidung und stellte nationale Interessen über wirtschaftliche Überlegungen. Anthropic befindet sich in einer schwierigen Lage, da die Anordnung kurz vor einem geplanten Börsengang kam und das Unternehmen gegen die Einstufung als Lieferketten-Risiko durch das Pentagon klagt.

Mathematical proof reveals why fixed AI guardrails can never block every jailbreak

2026-06-10Techxplore

Der Artikel mit dem Titel "Mathematical proof reveals why fixed AI guardrails can never block every jailbreak" untersucht die Grenzen von festen Sicherheitsmaßnahmen in Künstlicher Intelligenz (KI). Er argumentiert, dass es mathematische Beweise gibt, die zeigen, dass statische Schutzmechanismen nicht in der Lage sind, alle möglichen Umgehungen oder "Jailbreaks" zu verhindern. Diese Erkenntnis legt nahe, dass KI-Systeme dynamisch und anpassungsfähig gestaltet werden müssen, um potenziellen Missbrauch zu begegnen. Der Autor betont die Notwendigkeit, flexible und lernfähige Sicherheitsprotokolle zu entwickeln, die sich an neue Bedrohungen anpassen können. Die Diskussion hebt die Herausforderungen hervor, vor denen Entwickler stehen, wenn sie versuchen, KI-Systeme sicher zu gestalten, und warnt vor der Illusion, dass feste Regeln ausreichen, um alle Risiken zu minimieren.

Inaudible background sounds in videos could be used to hack smart speakers and AI assistants

2026-05-25The Independent

Forscher haben entdeckt, dass Cyberkriminelle inaudible Hintergrundgeräusche in Audio- und Videodateien nutzen können, um Smart Speaker und KI-Assistenten zu hacken. Diese als "auditory prompt injection" bezeichnete Methode erlaubt es Hackern, durch unhörbare Geräusche die Funktionen von KI-Modellen zu manipulieren und persönliche Informationen zu stehlen. Obwohl diese Angriffe weniger umfangreich sind als Text-Jailbreaks, können sie gravierende Folgen haben, indem sie KI-Systeme dazu bringen, unerlaubte Aktionen auszuführen, wie das Herunterladen schädlicher Dateien. In Tests an 13 modernen Audio-KI-Modellen lag die Erfolgsquote der Angriffe zwischen 79 und 90 Prozent, was auf erhebliche Sicherheitsanfälligkeiten hinweist. Da es derzeit keine spezifischen Abwehrmaßnahmen gegen diese Bedrohung gibt, warnen die Forscher vor den Risiken der zunehmenden Integration von KI in alltägliche Geräte. Zukünftige Forschungen sollten sich darauf konzentrieren, die praktischen Risiken in realen Anwendungen besser zu bewerten.

Jailbreaks

Einordnung

Verwandte Cluster