Avec Gemini 3.5 Flash, Google mise sur les agents, et non les chatbots, pour la prochaine vague d'IA

TechCrunchil y a 13 h

Atmosphère d'une présentation développeur sur la scène de la conférence Google I/O — Photo: Matheus Bertelli / Pexels

Google a annoncé son modèle de nouvelle génération Gemini 3.5 Flash lors du keynote d'ouverture de sa conférence développeurs I/O 2026 à San Francisco. Le PDG de l'entreprise, Sundar Pichai, l'a présenté depuis la scène : "C'est notre modèle le plus puissant à ce jour pour l'écriture de code et l'exécution autonome de tâches." L'impression rapportée par TechCrunch est que la salle était plus calme que lors des précédents lancements de Gemini ; mais la démonstration du modèle, qui a écrit du code à partir de zéro, l'a testé et a corrigé ses propres erreurs par étapes, a vite réchauffé la salle.

Gemini 3.5 Flash a été positionné comme le principal produit de l'approche "agent-first" suivie par Google cette année. L'entreprise estime que le paradigme du chatbot approche d'un point de saturation et que la prochaine croissance viendra de la capacité de l'IA à exécuter des tâches de manière automatique. Pichai a repris à plusieurs reprises ce cadrage : "non pas un système qui répond aux questions, mais un système qui accomplit des tâches."

Le directeur scientifique de DeepMind, Demis Hassabis, est monté sur scène pour parler des fondations techniques. Hassabis a déclaré que Gemini 3.5 Flash "amène un modèle plus puissant à l'efficacité avec un nombre de paramètres plus faible" ; le coût d'inférence du modèle est environ 40 % inférieur à celui des versions précédentes. C'est un point crucial pour la mise à l'échelle économique des applications fondées sur des agents.

Dans un scénario de démonstration, un développeur a donné à Gemini 3.5 Flash la commande "crée une application Streamlit sur GitHub ; relie-y une base de données SQL ; génère des données d'exemple ; déploie-la". Le modèle a écrit l'application, l'a testée, l'a poussée sur GitHub et l'a déployée sur Cloud Run en 4 minutes 18 secondes. C'est un niveau d'automatisation bien supérieur à l'usage traditionnel d'un chatbot.

Mais les limites techniques ont aussi été énoncées ouvertement à la conférence. Hassabis a indiqué que le modèle peut accumuler des "hallucinations" et des erreurs des étapes antérieures au cours d'une tâche ; pour un usage de type agent, Google met en avant la notion de points de validation intermédiaires appelés "checkpoints". Les développeurs pourront recueillir un second avis au milieu d'une tâche et infléchir la trajectoire du modèle.

Pour l'usage en entreprise, Google a identifié trois grands domaines d'application : le développement logiciel, l'analyse financière et l'automatisation du service client. L'entreprise a lancé des projets pilotes avec Mastercard, Sanofi et Vodafone via ses programmes partenaires. Mastercard utilise Gemini 3.5 Flash pour la revue automatique de code des modèles de détection de fraude, tandis que l'équipe R&D de Sanofi pilote le modèle pour l'analyse automatique de données de laboratoire.

Le responsable de Google Cloud, Thomas Kurian, a annoncé une nouvelle approche de tarification du modèle : une option de prix "à la tâche" arrive pour l'usage agent, proposée en alternative à la tarification traditionnelle au token. Les clients entreprises pourront estimer à l'avance le coût d'une tâche d'agent.

La dimension sécurité de l'IA agent était un autre point d'attention de la conférence. DeepMind a annoncé une nouvelle couche de sécurité pour Gemini 3.5 Flash, baptisée "Sentinel Guard" ; le système interrompt automatiquement le processus si l'agent tente d'accéder à un domaine non autorisé. De nombreux chercheurs en sécurité soulignent que les tests de sécurité des IA agent doivent devenir un standard industriel.

Les réactions des concurrents n'ont pas tardé. Le PDG d'Anthropic, Dario Amodei, a écrit sur X que les fonctions "agent continu" de Claude Code Plus rivaliseront avec Gemini. Le directeur technologique d'OpenAI a rappelé que GPT-5.5 est attendu au troisième trimestre. Il existe un quasi-consensus dans le secteur sur le fait que l'IA agent est le prochain grand champ de compétition.

La stratégie de Google positionne Gemini 3.5 Flash non seulement comme un modèle, mais aussi comme une couche d'infrastructure pour amener l'écosystème développeur vers les applications fondées sur des agents. L'entreprise a mis l'outil AI Studio, à titre gratuit, à la portée de tout développeur, à un niveau permettant de construire une application Android ; cela signifie que Gemini atteint non seulement les téléphones Pixel mais l'ensemble de l'écosystème Android. L'évaluation de TechCrunch est que Gemini 3.5 Flash constitue un carrefour qui testera le retour économique concret des années d'investissement de Google dans l'IA.

Cet article est un résumé éditorial assisté par IA basé sur TechCrunch. L'image est une photo d'archive de Matheus Bertelli sur Pexels.