Die Alibaba Group at ihren ersten KI-Inferenzchip vorgestellt, eine neuronale Verarbeitungseinheit (NPU), die auf die Beschleunigung von Machine-Learning-Aufgaben spezialisiert ist. Der Chip wurde von der Initiative T-Head im Rahmen der Alibaba Damo Academy zur Förderung der Technologieentwicklung und wissenschaftlichen Forschung entwickelt.
Der leistungsstarke KI-Inferenzchip wurde von CTO Jeff Zhang auf der jährlichen Apsara Computing Conference von Alibaba Cloud vorgestellt (Bild). Er wird derzeit im internen Alibaba-Geschäft eingesetzt, insbesondere bei der Produktsuche und der automatischen Übersetzung auf E-Commerce-Websites, bei personalisierten Empfehlungen, Werbung und intelligenten Kundendienstleistungen. Diese Bereiche benötigen umfangreiche Rechenleistung für KI-Aufgaben, um das Einkaufserlebnis zu optimieren.
Angetrieben von einem selbst entwickelten Hardware-Framework sowie hochoptimierten Algorithmen-Designs, die auf Geschäftsanwendungen wie Handel und Logistik im Alibaba-Ökosystem zugeschnitten sind, hat Hanguang 800 laut dem Hersteller bemerkenswerte Leistungen bei Tests erzielt. Die Single-Chip-Computerleistung erreichte 78,563 IPS im Spitzenmoment, während die Berechnungseffizienz während des Resnet-50 Inferenz-Tests 500 IPS/W während des Resnet-50 Inferenz-Tests betrug. Beide Leistungswerte liegen laut Alibaba weit über dem Branchendurchschnitt.
Alibaba liefert auch einen Vorher/Nachher-Vergleich. Täglich würden rund eine Milliarde Produktbilder von Händlern auf Taobao, die B2C-E-Commerce-Seite von
Alibaba, hochgeladen. Früher habe die Maschine eine Stunde gebraucht, um ein so großes Volumen an Bildern zu kategorisieren und dann die Suche und personalisierte Empfehlungen an Hunderte von Millionen Verbraucher anzupassen. Mit Hanguang 800 dauere es jetzt nur noch fünf Minuten, bis die Maschine die gleiche Aufgabe erledigt hat.
(ubi)