Amazon (NASDAQ:AMZN) Web Services (AWS) a annoncé le lancement de nouveaux serveurs de centres de données équipés de ses propres puces d'intelligence artificielle (IA), défiant ainsi la domination de Nvidia (NASDAQ:NVDA) dans le secteur. Apple Inc (NASDAQ:AAPL). a été confirmé comme client, prévoyant d'utiliser ces nouvelles puces Trainium2. L'unité cloud d'AWS a révélé que ces serveurs feront partie d'un superordinateur massif, qui intégrera des centaines de milliers de puces. Cette annonce a été faite mardi.
Ce superordinateur, alimenté par les puces Trainium2 d'AWS, sera utilisé par la startup d'IA Anthropic, première entreprise à exploiter cette technologie. Anthropic, connue pour créer des systèmes d'IA fiables et interprétables, utilisera cette puissance de calcul pour améliorer les capacités de ses modèles d'IA.
Benoit Dupin, un dirigeant d'Apple, a également reconnu que le géant technologique utilise les puces Trainium2, signalant une adoption significative de la nouvelle offre d'AWS.
Matt Garman, PDG d'AWS, a en outre révélé que l'entreprise travaille déjà sur Trainium3, la prochaine évolution de leur puce IA, dont le lancement est prévu pour l'année prochaine.
Les nouvelles instances Amazon Elastic Compute Cloud (Amazon EC2), alimentées par AWS Trainium2, sont désormais généralement disponibles et introduisent les Trn2 UltraServers. Ces UltraServers sont conçus pour offrir des performances exceptionnelles et une rentabilité optimale pour l'entraînement et le déploiement de modèles d'IA contemporains, y compris les grands modèles de langage (LLM) et les modèles de base (FM).
Les instances Trn2 promettent une amélioration de 30 à 40% du rapport prix/performance par rapport aux instances EC2 actuelles basées sur GPU et disposent de 16 puces Trainium2, offrant 20,8 pétaflops de calcul en pointe. Cela les rend idéales pour gérer des charges de travail d'IA avec des milliards de paramètres.
Pour des tâches d'IA encore plus exigeantes, les Trn2 UltraServers proposent un nouveau service EC2, comprenant 64 puces Trainium2 interconnectées pour un maximum de 83,2 pétaflops de calcul en pointe. Cette configuration quadruple les capacités de calcul, de mémoire et de réseau d'une seule instance, permettant l'entraînement et le déploiement des plus grands modèles d'IA au monde.
Le projet collaboratif entre AWS et Anthropic, nommé Project Rainier, vise à construire un EC2 UltraCluster de Trn2 UltraServers, qui deviendra le plus grand cluster de calcul IA au monde une fois achevé.
AWS a également mis en avant la future puce Trainium3, qui sera fabriquée en utilisant un nœud de processus de 3 nanomètres, promettant de quadrupler les performances des Trn2 UltraServers actuels.
Le kit de développement logiciel (SDK) AWS Neuron facilite l'optimisation des modèles d'IA pour fonctionner sur les puces Trainium, prenant en charge des frameworks populaires comme JAX et PyTorch, et est intégré au hub de modèles Hugging Face, qui héberge plus de 100.000 modèles.
Les instances Trn2 sont actuellement disponibles dans la région AWS US East (Ohio), avec des plans d'expansion de la disponibilité à d'autres régions prochainement. Pendant ce temps, les Trn2 UltraServers sont proposés en phase de prévisualisation.
Cet article a été généré et traduit avec l'aide de l'IA et revu par un rédacteur. Pour plus d'informations, consultez nos T&C.