Oracle et Nvidia viennent de franchir une nouvelle étape significative pour renforcer leur positionnement dans le domaine du cloud et de l’intelligence artificielle. Ce partenariat stratégique aspire à dynamiser le marché face à une concurrence de plus en plus féroce en introduisant des innovations majeures.
Une Collaboration pour des Performances Accrues
Oracle a annoncé l’intégration des GPU Nvidia L40S à son infrastructure Oracle Cloud Infrastructure (OCI). Cette initiative inclut également de nouvelles options pour les machines virtuelles utilisant des GPU H100 Tensor Core. Les puces L40S, spécialement conçues pour les centres de données, offrent une accélération notable sur plusieurs types de charges de travail, couvrant les applications d’IA générative, de graphisme et de vidéo.
Caractéristiques des Puces L40S
Les L40S sont équipées de cœurs Tensor de quatrième génération et supportent le format de données FP8. Ces puces se démarquent par leur capacité supérieure à entraîner et peaufiner des modèles de langage de taille petite à moyenne, tout en offrant une performance exceptionnelle pour l’inférence d’IA générative. Par exemple, un seul GPU L40S (FP8) produit jusqu’à 1,4 fois plus de jetons par seconde qu’un GPU A100 Tensor Core (FP16) pour le modèle Llama 3 8B avec TensorRT-LLM.
Disponibilité et Capacités Techniques
Le GPU L40S sera disponible sur OCI sous la forme de calcul bare-metal BM.GPU.L40S.4, comprenant quatre GPU L40S, chacun avec 48 Go de mémoire GDDR6. Cette configuration inclut également des disques NVMe locaux de 7,38 To, des processeurs Intel Xeon de 4e génération avec 112 cœurs, et 1 To de mémoire système. Ce setup vise à éliminer toute surcharge de virtualisation, idéal pour les charges de travail d’IA et d’apprentissage automatique à haute performance.
Expansion de l’Infrastructure OCI Supercluster
Oracle a également annoncé des mises à jour pour son service OCI Supercluster, qui supportera désormais jusqu’à 65 000 GPU Nvidia, contre 32 768 précédemment. Cette expansion répond aux besoins des entreprises qui entraînent les modèles d’IA les plus ambitieux avec des centaines de milliards de paramètres. En s’associant davantage avec Nvidia, Oracle compte bien se positionner en leader face à des compétiteurs tels qu’Amazon Web Services, Google Cloud Platform, et Microsoft Azure.