Intel a lancé sa conférence Vision 2024 avec le dévoilement de la puce de traitement Gaudi 3 AI. Gaudi 3 est conçu pour accélérer les charges de travail d’IA au niveau de l’entreprise, et Intel estime qu’il est plus rapide que la référence actuelle du secteur : le GPU H100 de Nvidia. Gaudi 3 utilise la même architecture et les mêmes principes sous-jacents que Gaudi 2, mais il utilise le processus 5 nm de TSMC (par rapport au 7 nm de TSMC dans Gaudi 2), ce qui le rend plus efficace. Gaudi 3 dispose de jusqu’à 128 Go de HBM2e avec 3,7 To/s de bande passante et 900 W de TDP. Intel a présenté des benchmarks comparant Gaudi 3 au leader du marché Nvidia et à son GPU H100 dominant, exécutant différents modèles de langages volumineux tels que LLAMA2-7B, LLAMA2-13B et GPT 3-175B. Gaudi 3 est jusqu’à 1,7 fois plus rapide. Intel affirme également que Gaudi 3 est jusqu’à 2,3 fois plus économe en énergie que le H100 de Nvidia. Intel a déjà envoyé des modèles Gaudi 3 refroidis par air pour échantillonnage à des partenaires dont la disponibilité générale suivra au troisième trimestre. Les unités refroidies par liquide arriveront au quatrième trimestre. Source