Der Cloud-Anbieter
Amazon Web Services (AWS) verkündet die allgemeine Verfügbarkeit einer neuen Generation von Cloud-Clustern, Amazon Elastic Compute Cloud (Amazon EC2) P4d Instanzen genannt. Diese von Nvidia GPUs befeuerten Server sollen im Vergleich zu bisherigen P3-Instanzen bis zu drei Mal mehr Performance und 250 Prozent mehr GPU-Memory leisten – und das bei 60 Prozent tieferen Kosten. Die Server sind, so AWS, besonders für Aufgaben im Bereich Machine Learning (ML) und High-Performance Computing (HPC) geeignet.
Die P4d-Systeme beinhalten jeweils acht Nvidia A100 Tensor Core GPUs und 400 Gpbs Bandbreite, was 16 Mal mehr ist, als es die P3-Vorgänger von AWS leisten konnten. Weiter können Kunden sogenannte EC2 Ultraclusters erstellen, die bis auf 4000 A100-GPUs skaliert werden können. Damit erlauben die Cloud-Instanzen bis zu doppelt so viel Skalierung als die Konkurrenz, wie AWS anfügt.
Besonders im Bereich Data Science erhofft sich AWS Traktion für den neuen Service, da deren Machine-Learning-Anwendungen mit immer komplexeren und grösseren Modellen auf mehr Leistung angewiesen seien, so der Cloud-Provider. Mit den neuen EC2-Instanzen sollen die ML-Modelle bis zu drei Mal schneller durchgerechnet werden können.
(win)