Kunden von
Google Cloud können ab sofort Instanzen buchen, die auf der sechsten Generation von Googles KI-Chip, genannt Trillium, basieren. Bei Trillium handelt es sich um die neueste Generation von Googles TPU (Tensor Processing Unit), die beim Training und dem Deployment von KI zum Einsatz kommt. Diese sechste Generation, den v6e, hat Google im Frühling 2024 angekündigt und intern bereits für die Entwicklung der zweiten Version von seines KI-Modells Gemini genutzt.
Der v6e soll gegenüber dem Vorgänger die Trainingsleistung von KI-Modellen vervierfachen und einen dreifachen Inferenzdurchsatz bieten. Ausserdem soll er um 67 Prozent energieeffizienter arbeiten. Detaillierte Informationen fasst Google Cloud
auf einer Dokumentationsseite zusammen. Dort steht unter anderem, dass der v6e eine maximale Compute-Leistung von 918 TFLOPS (16-Bit Floating Point) respektive 1836 TFLOPS (8-Bit Integer) erbringt.
Für Europa bietet Google Cloud Trillium-Instanzen in der Region europe-west4 an, die in einem Rechenzentrum in Amsterdam betrieben wird. Pro Chip-Stunde kostet eine Instanz On-demand 2,97 US-Dollar, bei längerer Verpflichtung sinkt der Preis auf 2,08 Dollar (1 Jahr) respektive 1,34 Dollar (3 Jahre), wie
der Preistabelle zu entnehmen ist. Die Europa-Preise sind damit etwas höher als das Pricing in den USA, aber günstiger als für Asia-Pacific.
(ubi)