Die Cloud-Sparte von Google hat virtuelle Maschinen vom Typ A4X eingeführt. Dahinter stecken Nvidias NVL72-Server, die mit GB200-GPUs bestückt sind, pro Server deren 72. Dazu kommern jeweils 36 Grace-CPUs. Die neuen VMs sind laut
Google Cloud für grosse KI-Workloads konzipiert, etwa für LLMs mit langem Kontextfenster, Reasoning-Modelle und Szenarien, die massiv konkurrente Verarbeitung erfordern. Ausserdem positioniert der Hyperscaler die A4X-VMs für allgemeines KI-Training und Entwicklung.
Im Vergleich zu den bisherigen A3-VMs, die auf Nvidias H100 basieren, sollen die neuen A4X-Instanzen die vierfache Training-Effizienz liefern. Google Cloud verspricht pro NVL72-System über 1 ExaFLOPS Leistung. Ausserdem nutzen die A4X-VMs Titanium-ML-Netzwerkadapter für eine schnelle und skalierbare Machine-Learning-Leistung mit einem CPU-to-GPU-Traffic mit niedriger Latenz und insgesamt bis zu 28,8 Terabit pro Sekunde.
(ubi)