Tech

Des agents d'IA codeurs ont appris à des robots à installer des GPU et à attacher des serre-câbles

Ars Technicail y a 15 h
Baie de serveurs en cours de maintenance technique dans un centre de données
Baie de serveurs en cours de maintenance technique dans un centre de donnéesPhoto: panumas nikhomkhai / Pexels

De nouveaux travaux rapportés par Ars Technica montrent que les agents d'IA codeurs de dernière génération peuvent superviser directement des robots physiques et les former à installer des GPU, à fixer des serre-câbles, à monter des baies et à effectuer d'autres tâches de maintenance de centre de données. L'étude marque une nouvelle étape à la croisée de l'apprentissage robotique et des agents fondés sur les grands modèles de langage.

L'équipe inclut des chercheurs de Boston Dynamics, Stanford et Anthropic. Dans le dispositif, le robot Atlas de Boston Dynamics a été dirigé par un agent d'IA codeur via des commandes en langage naturel. L'agent a généré du code qui traduit les mouvements des bras du robot en une couche de contrôle de bas niveau.

Les tâches sont issues d'opérations de maintenance réelles : insertion d'une nouvelle carte GPU dans un slot serveur, fixation de faisceaux de câbles par serre-câbles, remplacement de disques, ajustement des rails de baie. Ces gestes mobilisent une motricité fine que les techniciens humains mettent des années à acquérir. La plupart des recherches en robotique précédentes se concentraient sur des tâches plus simples de « prise et dépose ».

Dans les essais, le robot entraîné par l'agent IA a atteint 87 % sur l'installation de GPU, 81 % sur le serre-câble et 79 % sur le remplacement de disques. Par comparaison, un robot conventionnel entraîné sous supervision humaine a atteint 91-93 % sur des tâches similaires, mais avec un temps d'entraînement 12 fois plus long.

La véritable nouveauté est l'absence de plan prédéfini durant la supervision. L'agent IA a déterminé comment résoudre la tâche étape par étape, par une boucle planification en langage naturel - génération de code - observation puis ajustement. Après un essai infructueux, l'agent a pu lire le message d'erreur et réécrire le code.

Dans l'infrastructure d'agent, l'équipe a testé des modèles de langage de classe Claude et GPT-4. Le modèle Claude d'Anthropic obtient un taux de réussite supérieur de 6 % sur les tâches exigeant une planification multi-étapes ; les modèles de classe GPT-4 ont été plus rapides à générer du code. Les résultats indiquent que les deux modèles sont assez capables pour le flux de contrôle robotique.

Le secteur des centres de données s'intéresse à cette automatisation en raison d'une pénurie de main-d'œuvre. Le rapport 2025 de l'Uptime Institute indique qu'il manque plus de 450 000 techniciens dans le monde. Avec la construction de centres dédiés à l'IA et hyperscale, l'écart pourrait atteindre un million d'ici 2030.

Les chercheurs estiment que l'automatisation ne remplacera pas à court terme les techniciens humains mais qu'elle peut prendre en charge la maintenance de routine. La professeure Chelsea Finn, de Stanford, indique à Ars Technica : « Notre but est de permettre aux techniciens humains de se concentrer sur des problèmes complexes qui requièrent leur expertise ; un remplacement de GPU de routine peut être pris en charge par un agent IA. »

Des préoccupations de sécurité existent. Si un agent IA agit hors de son périmètre et envoie une commande erronée dans un centre de données, le risque d'endommager du matériel valant des milliards de dollars est réel. L'équipe précise que les essais incluaient un contrôleur d'arrêt physique et que la plage de mouvements de l'agent était définie à l'avance.

La prochaine étape consiste à mener l'expérience dans un centre de données hyperscale réel. Microsoft Azure et Google Cloud seraient impliqués dans le programme. Le passage à l'échelle suppose des conditions environnementales plus complexes, une plus grande diversité de matériel et des tests de fiabilité de longue durée. Les résultats sont attendus début 2027.

Cet article est un résumé éditorial assisté par IA basé sur Ars Technica. L'image est une photo d'archive de panumas nikhomkhai sur Pexels.

À lire ensuite