Google vient de mettre à jour Gemini 2.5 Pro avec des performances en codage significativement améliorées. Le modèle gagne 35 points sur WebDevArena selon le classement LMArena, et introduit une nouvelle fonctionnalité appelée « budget de réflexion » — disponible en preview dans l’API, d’après un communiqué de Google DeepMind.

Table des matières

Ce que change le « budget de réflexion »
Des scores qui parlent d’eux-mêmes
Et pour les utilisateurs non-développeurs ?

Le nouveau modèle est accessible aux développeurs via Google AI Studio et Vertex AI. La version preview est également déployée dans l’application Gemini grand public, permettant à chacun de tester les améliorations sans abonnement supplémentaire.

Ce que change le « budget de réflexion »

Le budget de réflexion, c’est un curseur que les développeurs règlent pour contrôler combien de temps le modèle « pense » avant de répondre. Moins de réflexion signifie une réponse rapide et moins coûteuse. Plus de réflexion garantit une précision maximale sur les tâches complexes.

En pratique, ça change tout pour les équipes techniques qui utilisent l’API Gemini.

Elles peuvent calibrer le coût de chaque requête selon l’enjeu réel. Une question simple ne consomme plus autant de ressources qu’un audit de code complet — ce qui représente une économie substantielle à l’échelle.

Des scores qui parlent d’eux-mêmes

Sur LMArena, le modèle enregistre 1 470 points, soit +24 par rapport à la version précédente, selon les données publiées par Google. Sur WebDevArena — le benchmark spécialisé dans la création d’interfaces web — il atteint 1 443 points, en hausse de 35 points.

Ces chiffres le positionnent comme l’un des modèles les plus compétitifs pour le développement frontend, aux côtés de GPT-5.4 Thinking et Claude Opus 4.6.

Et pour les utilisateurs non-développeurs ?

La version preview de Gemini 2.5 Pro est déjà visible dans l’application Gemini sur Android et iOS.

Les utilisateurs abonnés à Google One AI Premium y accèdent en priorité. Google annonce une version stable « plus tard ce mois-ci », selon l’équipe DeepMind. Pour les usages quotidiens — résumés, aide à la rédaction, questions complexes — les gains sont subtils mais réels sur les tâches longues et structurées.