Cursor Composer 2.5 défie Claude et GPT à dix fois moins cher

Stéphane Larue
Publié par
Stéphane Larue
Publié parStéphane Larue
Stéphane Larue est journaliste et éditeur indépendant spécialisé dans l actualité des médias, du divertissement et de la culture numérique. Fondateur du site stephanelarue.com, il assure...
5 Min de lecture
Photo : Markus Spiske / Pexels

La start-up Cursor a lancé Composer 2.5, son nouveau modèle d’intelligence artificielle dédié au code, le 18 mai 2026. Il égale les performances de Claude Opus 4.7 et de GPT-5.5 sur les principaux benchmarks de programmation, tout en coûtant dix fois moins cher à l’usage. Dans la foulée, l’éditeur annonce un modèle bien plus ambitieux, formé sur Colossus 2, le supercalculateur d’Elon Musk.

L’annonce est passée inaperçue du grand public français, mais elle agite la sphère des développeurs depuis quelques jours. Cursor, l’éditeur de l’environnement de programmation assisté par IA le plus populaire chez les ingénieurs, dégaine un modèle qui change l’équation économique du métier. Avec Composer 2.5, écrire du code avec une IA de premier rang devient soudain abordable.

Le modèle s’appuie sur la base ouverte Kimi K2.5 du laboratoire chinois Moonshot, déjà utilisée pour la version précédente. Cursor y a ajouté vingt-cinq fois plus de tâches synthétiques d’entraînement et une méthode inédite de retour textuel ciblé. Conséquence directe : sur le test de référence SWE-Bench Multilingual, Composer 2.5 atteint 79,8 % de réussite, devant GPT-5.5 (77,8 %) et au niveau d’Opus 4.7, selon The New Stack. Sur CursorBench v3.1, autre benchmark exigeant, l’écart avec GPT-5.5 grimpe à quatre points.

Un dixième du prix, sans perte de qualité

Ce que les développeurs retiennent surtout, c’est la facture. Cursor facture 0,50 dollar par million de tokens en entrée et 2,50 dollars par million en sortie. À titre de comparaison, Claude Opus 4.7 d’Anthropic coûte respectivement 5 et 25 dollars par million de tokens. L’écart est de un à dix, et même de un à trente sur les sorties.

Pour une équipe qui consomme plusieurs milliards de tokens par mois, la différence se chiffre en dizaines de milliers d’euros. C’est pour cette raison que les indépendants et les start-up regardent le modèle de très près. Cursor revendique déjà des performances similaires aux leaders sur des tâches longues, plusieurs heures d’autonomie sur des refactors complexes, et un suivi des instructions jugé plus fiable, d’après TechCrunch.

Le modèle compte environ mille milliards de paramètres au total, dont 32 milliards activés à chaque requête. Cursor a investi 85 % de son budget de calcul dans le post-entraînement, plutôt que dans la phase initiale. C’est un choix méthodologique qui tranche avec OpenAI ou Google, qui privilégient des modèles toujours plus massifs à former de zéro.

À retenir

  • Composer 2.5 égale Claude Opus 4.7 sur les benchmarks de code.
  • Le tarif est dix fois inférieur à celui d’Anthropic.
  • Cursor prépare un modèle géant sur Colossus 2 avec xAI.

Cursor s’allie à xAI pour viser plus grand

L’autre annonce, plus stratégique, concerne l’avenir. Cursor a confirmé qu’elle entraînait désormais un modèle nettement plus grand, en partenariat avec SpaceXAI, la branche infrastructure d’xAI. La machine utilisée n’est autre que Colossus 2, le supercalculateur d’Elon Musk basé à Memphis, qui mobilise environ un million de GPU équivalents H100. Le futur modèle bénéficiera d’un budget de calcul dix fois supérieur à celui consacré à Composer 2.5.

Le signal est clair. Après avoir bâti son succès sur l’orchestration des modèles tiers, Cursor veut posséder sa propre IA. L’éditeur quitte le rôle d’intégrateur pour devenir un acteur du modèle de bout en bout. Le calendrier reste flou, mais l’objectif est posé : rivaliser frontalement avec OpenAI, Anthropic et Google sur leur terrain.

En France, l’arrivée de Composer 2.5 ne fait que renforcer une tendance déjà visible chez les développeurs. Les outils IA verticaux, conçus pour un usage précis comme la programmation, gagnent du terrain face aux modèles généralistes plus coûteux. La CNIL n’a pas encore communiqué sur Cursor, mais l’éditeur propose un mode privacy qui n’envoie ni le code ni les prompts à des serveurs externes, un argument apprécié dans les équipes soumises à l’AI Act européen.

Reste une question pour l’utilisateur final. Si la qualité du code généré rejoint celle des leaders et que le prix s’effondre, qui paiera encore plein tarif chez Anthropic ou OpenAI demain ?

Partagez cet article
Publié parStéphane Larue
Follow:
Stéphane Larue est journaliste et éditeur indépendant spécialisé dans l actualité des médias, du divertissement et de la culture numérique. Fondateur du site stephanelarue.com, il assure une veille quotidienne sur les sujets d information générale, en s appuyant sur les sources officielles et les communiqués de presse. Il publie également des analyses, des interviews et des sélections éditoriales à destination d un large public.