Tech

Amazon va vendre ses puces d'IA hors d'AWS pour défier Nvidia plus frontalement

TechCrunchil y a 1 j
Rangées de baies de serveurs éclairées par des voyants bleus
Rangées de baies de serveurs éclairées par des voyants bleusPhoto: panumas nikhomkhai / Pexels

La charge d'IA qui a poussé Amazon Web Services (AWS) à concevoir ses propres puces serveurs à grande échelle ces trois dernières années franchit une nouvelle étape. Selon TechCrunch, Amazon s'apprête à vendre directement ses puces d'IA Trainium et Inferentia à des clients d'entreprise hors de son nuage AWS. C'est une intervention directe dans le marché des serveurs d'IA d'entreprise dominé par Nvidia.

La deuxième itération de la ligne Trainium, Trainium2, est déployée chez les clients AWS depuis cette année, notamment pour les charges d'entraînement de grands modèles d'Anthropic et Salesforce. Les sources citées par TechCrunch indiquent que la vente entreprise commencera par les baies Trainium2, suivies d'Inferentia3 puis de Trainium3 prévue pour l'an prochain.

La part de marché de Nvidia dans les puces d'IA se situe autour de 88 % selon les dernières estimations. À l'intérieur de ce chiffre, les produits de classe serveur (GPU de centre de données) se vendent à marge comprimée ; les gammes Hopper et Blackwell livrées chaque saison affichent un coût unitaire d'environ 60 000 à 90 000 dollars.

La ligne Trainium et Inferentia a historiquement concurrencé Nvidia à l'échelle serveur sur deux fronts. D'abord, le prix : Amazon pouvant amortir ses coûts de conception en interne, le prix de vente peut être maintenu de 40 à 50 % inférieur. Ensuite, une pile logicielle optimisée à l'intérieur du nuage AWS.

La question la plus cruciale pour les clients d'entreprise est ce second point : l'usage hors AWS. La performance historiquement plus faible de Trainium par rapport à la pile CUDA de Nvidia sur des cadres d'IA courants comme PyTorch et TensorFlow était une contrainte. L'article de TechCrunch indique qu'Amazon a développé une nouvelle couche de compatibilité transitoire pour combler cet écart.

Les benchmarks indépendants ne sont pas encore publiés ; mais selon les données partagées par Amazon, la performance de Trainium2 est environ 30 % plus efficace que Nvidia Hopper sur la base du coût total de possession. Inferentia3 réduit pour sa part de moitié le coût par token sur les charges d'inférence de classe GPT.

La question stratégique côté marché est composite : quel est l'avantage de long terme à ouvrir la vente directement aux clients plutôt qu'à conserver un écosystème fermé dans le nuage Amazon ? La réponse réside moins dans la marge matérielle que dans la couche logicielle : la plateforme Bedrock d'Amazon peut accompagner chaque déploiement personnalisé où les puces sont vendues.

Du côté de Nvidia, le dernier rapport de résultats a fait apparaître environ 35 milliards de dollars de revenus de puces serveurs liés à l'IA. Le coup d'Amazon vise 5 à 10 % de ce gâteau ; une pression significative sur Nvidia, mais pas un redessinement du marché.

Côté acheteurs d'entreprise, l'intérêt le plus concret vient des services financiers. Les équipes d'infrastructure cloud de JP Morgan et Wells Fargo ont confirmé qu'elles testeront le nouveau canal de vente d'Amazon ; les évaluations prévues couvrent des déploiements pilotes de 90 jours.

Vue d'ensemble : Nvidia ne perd pas son trône à court terme sur le marché des charges d'entraînement haut de gamme. Mais sortir ses puces du nuage est, pour Amazon, un coup à forte portée symbolique sur le marché du matériel d'IA d'entreprise. Cela sera lu comme la première entrée concrète d'une dynamique multi-fournisseurs sur un marché qui a fonctionné depuis dix ans comme une activité quasi mono-fournisseur.

Cet article est un résumé éditorial assisté par IA basé sur TechCrunch. L'image est une photo d'archive de panumas nikhomkhai sur Pexels.

À lire ensuite