Le fabricant de puces IA Groq lève 650 millions de dollars et reconstitue ses équipes : que signifie le «non-acqui-hire» à 20 milliards de Nvidia

Le spécialiste des puces d'inférence (model serving) en IA Groq a confirmé la clôture d'une levée de 650 millions de dollars. Selon TechCrunch, le tour a été mené par le fonds tech growth de BlackRock ; Founders Fund, Tiger Global et Samsung Catalyst Fund y ont également participé. La valorisation de l'entreprise a grimpé à 7,5 milliards de dollars.
L'investissement intervient après un bouleversement spectaculaire du personnel. Au début de l'année, Nvidia avait débauché environ 80 ingénieurs seniors — dont le fondateur de Groq Jonathan Ross — et plusieurs licences d'IP cœur dans un accord à 20 milliards de dollars qualifié de «non-acqui-hire». Le montage a été conçu pour éviter une acquisition classique et donc l'examen antitrust de la FTC et de l'UE.
Le montage est le suivant : Nvidia a payé 20 milliards de dollars en cash à Groq ; en échange, il a obtenu une licence croisée illimitée sur l'architecture Language Processing Unit (LPU) de Groq et a embauché les ingénieurs, dont Ross. Groq continue en tant que société indépendante, mais a perdu la moitié de son équipe technique la plus solide.
Le nouveau directeur général de Groq, Stuart Pann, a déclaré à TechCrunch : «Cet investissement finance une reconstitution d'équipe depuis la base et la prochaine génération d'architecture LPU ; dans trois ans, nous visons à retrouver l'avantage de performance créé par notre équipe fondatrice».
L'avantage de Groq repose sur une vitesse d'inférence déterministe, fondée sur un cache SRAM alloué de manière permanente. Comparé aux H200/B200 de Nvidia, il sert les jetons 3 à 5 fois plus vite, mais ne bénéficie pas de l'écosystème logiciel CUDA.
Le terme «non-acqui-hire» (not-acqui-hire) est apparu dans le secteur ces deux dernières années. Les opérations de Microsoft avec Inflection AI (équipe Mustafa Suleyman), d'Amazon avec Adept et de Google avec Character.AI suivent un schéma similaire, conçu pour éviter l'examen antitrust. La FTC américaine et la CMA britannique travaillent à durcir les règles pour que ces montages ne sortent pas de leur champ.
La FTC, dans un rapport publié en mai, a déclaré : «Ces transactions placent des fusions de fait hors de portée du contrôle antitrust contemporain». La Commission européenne a qualifié l'accord Microsoft-Inflection en février de «concentration» et ouvert une enquête formelle.
La nouvelle équipe de Groq se concentrera sur trois domaines : 1) la prochaine génération de l'architecture LPU ; 2) la pile logicielle (intégration PyTorch et compilateur maison) ; 3) la plateforme cloud inference-as-a-service. L'entreprise donne déjà accès à son API à plus de 12 000 développeurs.
Jonathan Hofer, responsable technologie chez l'investisseur principal BlackRock, a déclaré : «L'IP et la base clients de Groq sont solides ; nous investissons dans une feuille de route à trois ans sous une nouvelle direction technique». L'analyse de l'investisseur : même après le départ de ses fondateurs, Groq peut conserver sa place parmi les architectures alternatives majeures du marché de l'inférence.
La situation de Groq reflète un débat plus large sur la façon dont les start-ups doivent affronter les incumbents dominants à l'ère de l'IA. Le patron de Y Combinator, Garry Tan, a écrit sur X : «Les non-acqui-hires monétisent les équipes fondatrices mais vident la société d'origine ; cela pourrait rendre le secteur moins attractif pour la prochaine génération de fondateurs».
À lire ensuite

Qu'est-ce que YOLO26 ? Une introduction pratique au modèle de détection d'objets en temps réel
YOLO26, la dernière version de la famille YOLO, a fixé un nouveau point de référence pour la communauté de la vision par ordinateur en temps réel. Une introduction complète signée Roboflow détaille la nouvelle architecture, la facilité d'entraînement et les applications concrètes.

AMD rétablit le chiffrement mémoire sur ses processeurs grand public après la fronde des utilisateurs
AMD a annoncé rétablir, via une mise à jour de microcode, le chiffrement mémoire transparent désactivé sur ses derniers processeurs Ryzen 9000, après une campagne menée par des chercheurs en sécurité et des utilisateurs. Cette décision pourrait engager une course avec l'équivalent Total Memory Encryption d'Intel.

Crise de la RAM en 2026 : Valve raconte à quel point les négociations sur la mémoire sont devenues brutales
Étranglé par la demande des centres de données IA, le marché mondial de la mémoire fait grimper le prix de tout, des consoles de jeu aux smartphones. Le récit de Valve aux fabricants de Steam Machine montre que négocier de la DRAM et de la NAND en 2026 ressemble à «une opération de braquage».

Licenciements dans la tech en 2026 où les employeurs ont invoqué l'IA : la liste des coupes les plus importantes
TechCrunch tient à jour une liste des principaux licenciements dans la tech en 2026 dont les employeurs invoquent une même raison : l'intelligence artificielle. Selon les données, 78 000 travailleurs de la tech ont perdu leur emploi au cours des six premiers mois de l'année, la même semaine où leur entreprise annonçait des gains de productivité liés à l'IA.

Bilan des robotaxis 2026 : à quoi ressemble vraiment l'avance de la Chine — sept opérateurs, 18 villes — sur les États-Unis et l'Europe
Le nouveau bilan des robotaxis de TechCrunch Mobility place les opérateurs chinois loin devant leurs rivaux américains et européens sur le nombre de courses quotidiennes, l'empreinte urbaine et la taille de flotte. Décryptage des données et des raisons de cet écart en 2026.
