Der auf Website-Sicherheit und CDN-Dienste spezialisierte Anbieter
Cloudflare erweitert sein Portfolio um ein Tool, mit dem sich verhindern lässt, dass KI-Bots Inhalte von der eigenen Website abholen, um sie für das Training von Sprachmodellen (LLMs) zu verwenden. Laut Cloudflare wollen über 80 Prozent der Kunden sich gegen dieses als Scraping bezeichnete Vorgehen wehren.
Anbieter von generativer KI sind darauf angewiesen, dass LLMs mit Inhalten trainiert werden. Hierbei zeigen sich die jeweiligen Protagonisten nicht gerade zimperlich. So wurde unlängst Google von französischen Wettbewerbsbehörden zu einer Busse von 250 Millionen Euro verdonnert, weil der Konzern seine Gemini-KI (damals noch Bard genannt) ohne Erlaubnis mit Inhalten französischer Medienhäuser trainierte ("Swiss IT Magazine"
berichtete).
Tatsächlich sind KI-Bots in den Logs der meisten Websites aufzufinden. Laut Cloudflare findet sich am häufigsten der KI-Bot Bytespider vom Tiktok-Betreiber Bytedance, der bei über 40 Prozent aller Kunden in Erscheinung tritt. Mit dem neuen Cloudflare-Tool lässt sich der Zugang dieser Bot zur eigenen Website nun per Mausklick blockieren. Das neue Feature wird in allen Plänen von Cloudflare angeboten, inklusive dem kostenlosen Angebot.
(rd)