KI-Sicherheitsbeschränkungen lassen sich mit simpler ASCII-Kunst austricksen

Quelle: SITM

KI-Sicherheitsbeschränkungen lassen sich mit simpler ASCII-Kunst austricksen

Übergibt man einer generativen KI Anweisungen als ASCII-Kunst, werden die Sicherheitsmassnahmen ausgehebelt und selbst Anleitungen für Bomben werden geliefert.

11. März 2024

KI-Sicherheitsbeschränkungen, die etwa dafür sorgen, dass keine Anleitungen für den Bombenbau verbreitet werden, lassen sich mit einfachsten Mitteln umgehen. So ist es laut einem Bericht von "Toms Hardware" US-amerikanischen Forschern gelungen, die Sicherheitsmassnahmen zu überlisten, indem die Anweisungen in Form von ASCII-Kunst der KI übergeben werden.

Wird eine KI per Tastaturanweisung gefragt, wie man eine Bombe baue, wird die Frage aufgrund der geltenden Sicherheitsbestimmungen zurückgewiesen. Wird das Wort "Bombe" aber nicht getippt, sondern als ASCII-Grafik übermittelt, spuckt die KI die angeforderte Antwort aber anstandslos aus. Die Forscher haben mit dem als ArtPrompt bezeichneten Angriffsvektor gängige Sprachmodelle wie GPT-3.5, GPT-4, Claude, Gemini sowie Llama2 getestet. Sie halten fest, dass der Erfolg des Jailbreak via ArtPrompt zwar von der Grösse und Anordnung der ASCII-Zeichen abhängt, doch liessen sich alle getesteten LLMs zu unerwünschtem Verhalten bewegen. (rd)

(Quelle: Fengqing Jiang/University of Washington)

(Quelle: SITM)

Artikel kommentieren

Wie Workplace as a Service den digitalen Arbeitsplatz neu ordnet

Wie Workplace as a Service den digitalen Arbeitsplatz neu ordnet

Ob Remote-Arbeit, neue Sicherheitsanforderungen oder die Flut an Endgeräten – der Arbeitsplatz der Zukunft ist eine Herausforderung. Workplace as a Service bietet einen Weg, das Chaos zu strukturieren: standardisiert, sicher, flexibel – und vor allem so, dass IT und Mitarbeitende endlich durchatmen können.

Phishing-Alarm in Microsoft 365 und Google Workspace

Phishing-Alarm in Microsoft 365 und Google Workspace

Wie Unternehmen sich vor Homoglyphen- und Spoofing-Angriffe schützen können

Erfolg mit KI-Agenten durch fünf Schlüsselfaktoren

Erfolg mit KI-Agenten durch fünf Schlüsselfaktoren

KI-Agenten revolutionieren das Kundenerlebnis: Sie analysieren Daten, erstellen Pläne und handeln überwiegend autonom. KI-Agenten eröffnen Unternehmen neue Möglichkeiten von automatisierten Serviceanfragen bis hin zu komplexen Abläufen, die ohne menschliches Zutun durchgeführt werden.

Die effizienteste IT-Strategie? Ist hybrid.

Die effizienteste IT-Strategie? Ist hybrid.

CIOs verstehen die digitale Transformation oft als unabdingbaren Wechsel ihrer gesamten IT in die Cloud. Doch die Online-Dienste entfalten ihren grössten Vorteil in Kombination mit lokalen Installationen. Hybrid Computing macht deshalb nicht umsonst ‚die Runde‘: Schliesslich gewährleistet es Sicherheit und Kontrolle durch eigene IT-Ressourcen – und volle Agilität in der Cloud. Björn Orth, Geschäftsführer des Microsoft Solutions Partners VENDOSOFT bricht eine Lanze für diese Form der hybriden Lizenzierung.

Wirkung im Ziel!

Wirkung im Ziel!

Was wäre, wenn Aus- und Weiterbildungen unmittelbar sichtbare Wirkung zeigten? Nein, dies ist keine Fiktion. Drei einfache Schritte führen zum Ziel.

Cyber Resilience Act: Auswirkungen auf Embedded Device Security

Cyber Resilience Act: Auswirkungen auf Embedded Device Security

Der Cyber Resilience Act verändert die Sicherheitsanforderungen für Embedded Devices grundlegend. Welche neuen Herausforderungen kommen auf Unternehmen zu? Wie lassen sich Compliance-Vorgaben effizient umsetzen? Gemeinsam mit unserem Partner ONEKEY zeigen wir, wie Sie Sicherheitsrisiken minimieren und Embedded Devices optimal schützen.

GOLD SPONSOREN

SPONSOREN & PARTNER