Amazon va vendre ses puces d'IA hors d'AWS pour défier Nvidia plus frontalement

TechCrunchil y a 1 j

Rangées de baies de serveurs éclairées par des voyants bleusPhoto: panumas nikhomkhai / Pexels

La charge d'IA qui a poussé Amazon Web Services (AWS) à concevoir ses propres puces serveurs à grande échelle ces trois dernières années franchit une nouvelle étape. Selon TechCrunch, Amazon s'apprête à vendre directement ses puces d'IA Trainium et Inferentia à des clients d'entreprise hors de son nuage AWS. C'est une intervention directe dans le marché des serveurs d'IA d'entreprise dominé par Nvidia.

La deuxième itération de la ligne Trainium, Trainium2, est déployée chez les clients AWS depuis cette année, notamment pour les charges d'entraînement de grands modèles d'Anthropic et Salesforce. Les sources citées par TechCrunch indiquent que la vente entreprise commencera par les baies Trainium2, suivies d'Inferentia3 puis de Trainium3 prévue pour l'an prochain.

La part de marché de Nvidia dans les puces d'IA se situe autour de 88 % selon les dernières estimations. À l'intérieur de ce chiffre, les produits de classe serveur (GPU de centre de données) se vendent à marge comprimée ; les gammes Hopper et Blackwell livrées chaque saison affichent un coût unitaire d'environ 60 000 à 90 000 dollars.

La ligne Trainium et Inferentia a historiquement concurrencé Nvidia à l'échelle serveur sur deux fronts. D'abord, le prix : Amazon pouvant amortir ses coûts de conception en interne, le prix de vente peut être maintenu de 40 à 50 % inférieur. Ensuite, une pile logicielle optimisée à l'intérieur du nuage AWS.

La question la plus cruciale pour les clients d'entreprise est ce second point : l'usage hors AWS. La performance historiquement plus faible de Trainium par rapport à la pile CUDA de Nvidia sur des cadres d'IA courants comme PyTorch et TensorFlow était une contrainte. L'article de TechCrunch indique qu'Amazon a développé une nouvelle couche de compatibilité transitoire pour combler cet écart.

Les benchmarks indépendants ne sont pas encore publiés ; mais selon les données partagées par Amazon, la performance de Trainium2 est environ 30 % plus efficace que Nvidia Hopper sur la base du coût total de possession. Inferentia3 réduit pour sa part de moitié le coût par token sur les charges d'inférence de classe GPT.

La question stratégique côté marché est composite : quel est l'avantage de long terme à ouvrir la vente directement aux clients plutôt qu'à conserver un écosystème fermé dans le nuage Amazon ? La réponse réside moins dans la marge matérielle que dans la couche logicielle : la plateforme Bedrock d'Amazon peut accompagner chaque déploiement personnalisé où les puces sont vendues.

Du côté de Nvidia, le dernier rapport de résultats a fait apparaître environ 35 milliards de dollars de revenus de puces serveurs liés à l'IA. Le coup d'Amazon vise 5 à 10 % de ce gâteau ; une pression significative sur Nvidia, mais pas un redessinement du marché.

Côté acheteurs d'entreprise, l'intérêt le plus concret vient des services financiers. Les équipes d'infrastructure cloud de JP Morgan et Wells Fargo ont confirmé qu'elles testeront le nouveau canal de vente d'Amazon ; les évaluations prévues couvrent des déploiements pilotes de 90 jours.

Vue d'ensemble : Nvidia ne perd pas son trône à court terme sur le marché des charges d'entraînement haut de gamme. Mais sortir ses puces du nuage est, pour Amazon, un coup à forte portée symbolique sur le marché du matériel d'IA d'entreprise. Cela sera lu comme la première entrée concrète d'une dynamique multi-fournisseurs sur un marché qui a fonctionné depuis dix ans comme une activité quasi mono-fournisseur.

Cet article est un résumé éditorial assisté par IA basé sur TechCrunch. L'image est une photo d'archive de panumas nikhomkhai sur Pexels.

À lire ensuite

Une illustration scientifique abstraite d'un neurone et d'une synapse.

Plus dans Tech

La découverte qui a changé la façon dont les scientifiques pensent la mémoire : retour sur le prix Kavli 2026

Le prix Kavli 2026 en neurosciences récompense des travaux montrant que les cellules cérébrales marquent les expériences passées par des « étiquettes synaptiques » pour les déplacer vers la mémoire à long terme. La note d'IBM Think interroge l'impact possible sur la conception de l'IA.

Hacker News

Un récif corallien sous-marin avec une lumière douce et des herbiers marins.

Tech

Certains récifs coralliens pourraient-ils survivre au réchauffement ? Les scientifiques cherchent les exceptions

Les récifs coralliens sont parmi les écosystèmes les plus rapidement endommagés par le réchauffement climatique. Ars Technica raconte comment les scientifiques cherchent des coraux tolérants à la chaleur qui pourraient servir de « récifs-sources » dans les océans plus chauds de demain.

Ars Technicail y a 15 h

Vue lointaine d'une rampe de lancement de fusée sous un ciel dégagé.

Tech

NASA confie à la société de fusées d'Eric Schmidt une mission vers Mars en 2028

La NASA a choisi Relativity Space — la société de fusées que l'ancien directeur général de Google Eric Schmidt a rachetée en 2025 — pour mener sa prochaine mission martienne à bas coût. Selon The Verge, le contrat de 1,2 milliard de dollars vise une fenêtre de lancement à l'été 2028.

The Vergeil y a 15 h

Un écran de smartphone affichant une fenêtre de conversation de messagerie vide.

Tech

L'interdiction de Telegram en Inde déclenche une ruée vers les VPN et les messageries concurrentes

Le blocage de Telegram en Inde pousse des dizaines de millions d'utilisateurs vers les VPN et les messageries alternatives. Selon TechCrunch, la décision relance un débat plus large sur la modération des contenus et la conformité des données.

TechCrunchil y a 15 h

Tech

Toutes les start-up de fusion ayant levé plus de 100 millions de dollars : où le capital privé a porté la fusion nucléaire

TechCrunch dresse la liste des 14 start-up de fusion nucléaire qui ont franchi la barre des 100 millions de dollars levés. Le capital privé total du secteur dépasse désormais 9 milliards de dollars, avec des approches allant du confinement magnétique à l'inertiel et aux conceptions hybrides.

TechCrunchil y a 15 h

Une salle de réunion diplomatique en table ronde vide sous lumière grise

Moyen-Orient

L'Iran menace d'« actions réciproques » si Washington ne respecte pas le MOU

Al Jazeerail y a 3 h