Visuelles GPT-4 lässt sich leicht manipulieren

Visuelles GPT-4 lässt sich leicht manipulieren

KI-Modelle sind nach wie vor anfällig für Manipulation: Das zeigt Forscher Simon Willison anhand von GPT-4V und einer abgewandelten Prompt Injection.
17. Oktober 2023

     

Auch visuelle KI-Modelle wie GPT-4V lassen sich via der Prompt Injection-Methode manipulieren. Das erklärt KI-Forscher Simon Willison in einem Blog-Eintrag. Bei Prompt Injection handelt es sich üblicherweise um Texteingaben, die das Ignorieren früherer Anweisungen und Richtlinien, die Offenlegung zugrundeliegender Daten oder die Manipulation der Ausgabe zur Folge hat, um Inhalte zu erzeugen, die normalerweise untersagt sind.


Willison hat das Vorgehen nun für das visuelle Modell leicht abgewandelt. Möglich ist die Manipulation über in die Bilder eingefügte Textbefehle. Das führt dazu, dass das KI-Modell andere Anweisungen des Nutzers ignoriert und dem Text im Bild folgt. Dieser kann zudem als nicht sichtbarer Inhalt in der Datei versteckt werden – beispielsweise als Schrift auf weissem Hintergrund.
"Ich finde nichts davon besonders überraschend", schreibt Willison. "Dies sind klassische Prompt-Injection-Angriffe, und Prompt Injection bleibt ein hartnäckig ungelöstes Problem – 13 Monate, nachdem wir angefangen haben darüber zu reden!" Das grundsätzliche Problem sei: "Grosse Sprachmodelle sind leichtgläubig. Ihre einzige Informationsquelle sind ihre Trainingsdaten in Kombination mit den Informationen, die Sie ihnen geben. Wenn Sie sie mit einer Eingabeaufforderung füttern, die bösartige Anweisungen enthält – wie auch immer diese Anweisungen präsentiert werden –, werden sie diese Anweisungen befolgen." Das sei schwer zu lösen, so Willison. "Der Versuch, zwischen guten Anweisungen und schlechten Anweisungen zu unterscheiden, ist ein sehr schwieriges – und derzeit unlösbares – Problem." Das Einzige, was man aktuell tun könne, bleibe es, sich dieser Herausforderung bewusst zu sein. (sta)


Weitere Artikel zum Thema

ChatGPT darf wieder im Internet stöbern

28. September 2023 - ChatGPT arbeitete bis heute noch immer mit Trainingsdaten bis zum Jahr 2021. Nun darf die KI endlich wieder im Netz nach aktuellen Informationen suchen.

ChatGPT ist nun bereit für eine Konversation

26. September 2023 - OpenAI erweitert ChatGPT um einen Sprachassistenten, mit welchem man ausserdem über Bilder sprechen kann. Vorerst geht das aber nur auf Englisch.

OpenAI lanciert ChatGPT Enterprise für Unternehmen

29. August 2023 - Mit einer dedizierten Unternehmens-Version will OpenAI das grosse Interesse an ChatGPT in Unternehmen gebührend adressieren können. ChatGPT Enterprise bietet unter anderem mehr Sicherheit, unbegrenzte Nutzung und Admin-Tools.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Welche Farbe hatte Rotkäppchens Kappe?
GOLD SPONSOREN
SPONSOREN & PARTNER