Microsoft rapporte que le coût par token de l'IA générative dépasse désormais celui de l'embauche d'employés humains

Hacker Newsil y a 1 h

Racks de serveurs de centre de données moderne — Photo: panumas nikhomkhai / Pexels

Le rapport du quatrième trimestre fiscal 2026 de Microsoft a produit un point de données critique pour l'industrie : le coût par token des applications d'IA générative est 18 % supérieur au coût horaire d'un employé humain produisant un travail équivalent. Le magazine Fortune a qualifié le chiffre, présenté dans le rapport financier de Microsoft sous l'intitulé 'AI Tax Margin', de première comparaison ouvertement publiée du secteur.

La directrice financière de Microsoft Amy Hood a déclaré lors de la conférence téléphonique sur les résultats : 'Les coûts d'infrastructure de l'IA générative, le capital des GPU et la consommation d'énergie sont supérieurs au prix du service IA répercuté aux clients. C'est un déséquilibre à court terme ; à mesure que les coûts d'infrastructure de l'IA continuent de baisser, les prix clients seront ajustés avec prudence.' Microsoft a dépensé 24,3 milliards de dollars en infrastructure d'IA au quatrième trimestre fiscal 2026 — une augmentation de 78 % par rapport au même trimestre de l'exercice 2025.

Le rapport constitue un point de données concret pour les universitaires et praticiens débattant de la logique économique de l'IA générative. Le professeur Erik Brynjolfsson de la MIT Sloan School of Management a écrit dans un commentaire sur Hacker News : 'Voici le point de données que nous attendions depuis longtemps dans le secteur de l'IA. Jusqu'à présent nous ne l'entendions que dans le discours de Sam Altman chez OpenAI ; une fois que Microsoft le rapporte dans des dépôts financiers, l'économie en temps réel du secteur devient discutable.'

Le chiffre du rapport de Microsoft implique un coût par token d'environ 0,025 dollar pour les modèles de sortie de niveau GPT-4o — un coût quotidien de 250 dollars pour un client d'entreprise de taille moyenne consommant 10 millions de tokens par jour. Un analyste humain capable de produire le même rendement, à un coût estimé de 38 dollars de l'heure utilisé par le groupe Foundation Engineering de Microsoft, coûterait 304 dollars pour une journée de 8 heures. Donc le coût de l'IA est 18 % inférieur au coût humain ; mais le rapport de Microsoft indique que le coût réel atteint 359 dollars lorsque l'infrastructure (amortissement du capital, énergie et refroidissement) est incluse — 18 % au-dessus du coût humain.

Le chiffre inverse la ligne standard de l'industrie selon laquelle 'l'IA est très bon marché'. Les services phares d'Anthropic, OpenAI et Google sont vendus en dessous du prix de revient aux clients. Selon des documents internes d'OpenAI partagés avec Bloomberg, la société tarifait en moyenne l'accès au niveau GPT-5 38 % en dessous du coût réel. Le même écart est de 42 % pour Claude 4.7 d'Anthropic et de 35 % pour Gemini 2.5 Pro de Google.

L'analyste sectorielle Cassidy McGillicuddy de TBR Research a commenté : 'Dans ce modèle, un hyperscaler fournissant un service d'IA tokenisé à un client n'est pas durable. Soit les prix doivent augmenter sur le reste de 2026 ou jusqu'à mi-2027, soit les coûts d'infrastructure doivent baisser significativement. Une troisième option est que le client absorbe la marge de perte — mais cela ne correspond pas à la dynamique concurrentielle du secteur.'

L'asymétrie a trois moteurs principaux. Premièrement, le coût énergétique majeur de l'IA générative : un appel GPT-4o consomme 30 à 40 fois plus d'énergie qu'une recherche Google. Selon le rapport de durabilité de Microsoft de décembre 2025, la consommation d'énergie de la société a augmenté de 75 % depuis 2024 ; plus de 80 % de cette hausse provient des charges de travail d'IA. Deuxièmement, le coût des puces d'IA (Nvidia H100, B100 et la prochaine génération Rubin). Troisièmement, les systèmes de refroidissement pour les centres de données d'IA — en particulier le refroidissement liquide pour les racks de GPU — constituent une ligne de coût additionnelle significative.

Quel est l'effet sur la tarification client de Microsoft ? La société a annoncé qu'elle appliquera une hausse de prix de 15 à 25 % aux clients à compter du 1er septembre 2026. Cela touchera Microsoft Copilot Enterprise (tarifé par utilisateur par mois pour M365 Copilot), Azure OpenAI Service et les services Foundry AI. La société a qualifié la hausse de prix de 'transfert du coût de l'infrastructure IA au client'. Les clients pourront envisager de passer à des fournisseurs d'IA alternatifs en réponse.

Le rapport d'asymétrie de Microsoft remet aussi en question la thèse de remplacement de la main-d'œuvre par l'IA. Le rapport de McKinsey & Company de septembre 2025 estimait que l'IA générative pourrait remplacer 12 à 15 millions d'emplois salariés humains aux États-Unis d'ici 2030 — environ 8 % de la main-d'œuvre américaine totale. Le nouveau point de données de Microsoft suggère que ce calendrier pourrait être retardé ; la comparaison de coûts entre l'IA générative et la main-d'œuvre humaine ne sera pas égalisée pendant quelques années supplémentaires en raison des ajustements de prix. La réaction de Wall Street est mitigée : l'action Microsoft a clôturé vendredi en baisse de 2,8 %, mais les prévisions financières FY2027 ont préservé la confiance des investisseurs dans le rôle à long terme de l'IA. L'analyste Microsoft de Goldman Sachs, Kash Rangan, a dit : 'Il est connu que les coûts d'IA pèseront sur les marges client, mais que Microsoft le rapporte avec netteté est un pas audacieux — une divulgation potentiellement utile à la confiance sectorielle.'

La publication du rapport Fortune coïncide avec une semaine où Sam Altman a été interrogé : le 21 mai, la porte-parole d'OpenAI Hannah Wong a déclaré : 'Il est vrai que les coûts d'IA générative sont supérieurs aux prix clients, mais nous croyons que cette situation est transitoire. Une fois les centres de données Stargate prêts d'ici fin 2026, les coûts baisseront significativement.' Le rapport de Microsoft de vendredi indique une réalité arithmétique plus concrète sous le discours d'OpenAI.

Les 12 à 18 prochains mois seront un véritable test pour l'économie de l'IA. Après la décision de hausse de prix de Microsoft, la manière dont les rivaux comme Anthropic, Google et OpenAI réagiront reste incertaine. L'ensemble du secteur pourrait augmenter ses prix ; ou une course à l'infrastructure d'IA à forte capacité (Nvidia Rubin et puces successrices, systèmes de refroidissement plus efficaces) pourrait faire baisser les coûts rapidement. Pour les clients, la question pratique est de savoir si le ROI sur les investissements d'IA d'entreprise doit être réévalué dans l'environnement tarifaire 2026-2027.

*Cet article n'est pas un conseil d'investissement. Prenez vos décisions d'investissement en faisant vos propres recherches ou en consultant un conseiller en investissement.*

Cet article est un résumé éditorial assisté par IA basé sur Hacker News. L'image est une photo d'archive de panumas nikhomkhai sur Pexels.