Microsoft Research beschleunigt LLM-Verarbeitung mit Splitwise

Die von Microsoft Research entwickelte neue Technologie Splitwise soll einen Durchbruch bei der Performance grosser KI-Sprachmodelle bringen.

9. Januar 2024

Grosse KI-Sprachmodelle (Large Language Models, LLMs) benötigen enorme Leistung, die im Allgemeinen von spezialisierten GPUs kommt. Diese sind teuer und verbrauchen viel Strom – für die Provider von KI-Diensten aus der Cloud ebenfalls ein riesiger Kostenpunkt.

Forscher des Microsoft-Azure-Teams habem sich des Problems angenommen und sind zu einer verblüffenden Lösung gekommen. Eine neue Technologie namens Splitwise soll die Inferenzberechnungen der LLMs deutlich effizienter und nachhaltiger machen. Die Verarbeitung wird dabei in die zwei Phasen Prompt-Verarbeitung und Token-Generierung unterteilt und diese auf verschiedene GPU-Cluster und Maschinen verteilt. Splitwise macht sich die Tatsache zunutze, dass die Prompt-Verarbeitung viel GPU-Rechenkapazität in Anspruch nimmt, während die Token-Generierung auf eine hohe Memory-Bandbreite angewiesen ist.

Genaueres zu Splitwise schildert ein ausführliches Paper. Microsoft will mit Splitwise einen 1,4-fachen Durchsatz bei 20 Prozent niedrigeren Kosten als bei bisherigen Systemdesigns beziehungsweise den 2,35-fachen Durchsatz bei gleichen Kosten und Energiebudgets erreicht haben. (ubi)

Ein Jahr KI-Chatbots: Neues für Bing und Copilot

6. Dezember 2023 - ChatGPT ist ein Jahr alt, die Bing KI wird’s auch bald. Microsoft zeigt nun auf, welche Features bei Bing und Copilot in der Pipeline sind.

Michio Kaku: KI ist bloss ein besseres Tonbandgerät

14. August 2023 - Der theoretische Physiker Michio Kaku und der KI-Chefwissenschaftler von Meta finden, die Menschheit müsse keine Angst vor einer Bedrohung durch künstliche Intelligenz haben.

Microsoft Build 2023: KI-Copiloten und Chatbot-Plug-ins

1. Juni 2023 - Einmal mehr stand die Microsoft-Build-Konferenz ganz im Zeichen der künstlichen Intelligenz. Angekündigt wurden unter anderem ein Copilot für Windows, die neue Data-Plattform Microsoft Fabric, das Azure AI Studio sowie eine Plug-in-Architektur für KI-Chatbots.

Artikel kommentieren

Advertorial

Microsoft Research beschleunigt LLM-Verarbeitung mit Splitwise

Ein Jahr KI-Chatbots: Neues für Bing und Copilot

Michio Kaku: KI ist bloss ein besseres Tonbandgerät

Microsoft Build 2023: KI-Copiloten und Chatbot-Plug-ins

Wie KI das Telefonieren verändert

Blick in die Zukunft: KI-Boost durch Quantum?

AWS Summit Zürich 2024

Dateninfrastruktur treibt KI-Erfolg voran

Starke Cyber-Resilienz basiert auf zwei Grundpfeilern

Die neue KMU Business-Software «CustomerCore» ist online