IA & Machine Learning Article original TECH ACTU

Cursor Composer 2.5, Copilot à l'usage, Claude Code libéré : le grand chamboulement des coding assistants

Jean-Paul Lesein 5 min de lecture 88 vues
Cursor Composer 2.5, Copilot à l'usage, Claude Code libéré : le grand chamboulement des coding assistants

En mai 2026, quatre coding assistants bougent en même temps. Cursor lance Composer 2.5, son modèle maison : 79,8 % sur SWE-Bench, au niveau d'Opus 4.7, à $0,50/M tokens — 10x moins cher. GitHub Copilot passe à la facturation à l'usage le 1er juin (AI Credits). Claude Code double ses limites (5h → 10h) via un deal SpaceX/Colossus 1. Windsurf monte ses prix (Pro $20, Max $200). Signal de fond : la fin du prix fixe pour les outils de coding IA.

En mai 2026, quatre grandes plateformes de coding IA ont toutes bougé en même temps — mais pas dans la même direction. Cursor a sorti son propre modèle maison qui rivalise avec Claude Opus 4.7 à un dixième du prix. GitHub Copilot abandonne le forfait fixe pour la facturation à l'usage à partir du 1er juin. Claude Code a doublé ses limites. Windsurf a augmenté ses prix. Le paysage des outils de développement IA n'a jamais été aussi mouvant — ni aussi révélateur de ce qui se joue vraiment derrière les benchmarks.

Cursor Composer 2.5 : un modèle maison qui défie les géants

Cursor a franchi une étape structurelle le 18 mai avec le lancement de Composer 2.5, leur premier modèle entraîné en interne spécifiquement pour les tâches de coding agentique. Les chiffres sont nets : sur SWE-Bench Multilingual, Composer 2.5 atteint 79,8 %. Sur CursorBench v3.1, 63,2 %. Ces scores le placent au niveau de Claude Opus 4.7 et GPT-5.5 sur les tâches de résolution de bugs réels.

La vraie nouvelle, c'est le prix : $0,50 par million de tokens en entrée et $2,50 en sortie. Soit environ 10 fois moins cher que Claude Opus 4.7 ($25/M en sortie) pour des performances comparables sur le code. Sur Terminal-Bench 2.0 — qui évalue l'exécution de commandes shell autonomes — Composer 2.5 score 69,3 % contre 69,4 % pour Claude Opus 4.7. Pratiquement identiques. GPT-5.5 se détache à 82,7 % sur ce benchmark spécifique, mais l'écart se réduit considérablement sur le refactoring et le bug-fixing.

L'innovation technique derrière ce résultat : une méthode de Reinforcement Learning ciblé avec des hints localisés dans les trajectoires d'entraînement (plutôt qu'un signal de récompense unique en fin de rollout), 25x plus de tâches synthétiques que Composer 2, et une optimisation Sharded Muon pour le continued pretraining. Cursor a industrialisé une approche qui vient du monde de la recherche — et ça se voit dans les résultats.

Ce que fait Cursor ici est stratégiquement important : ils ne dépendent plus d'Anthropic ou d'OpenAI pour leur modèle de base. Ils peuvent optimiser directement pour les tâches de coding, contrôler leurs coûts, et ne plus être exposés aux changements de pricing upstream. C'est le modèle Mistral appliqué aux coding assistants.

GitHub Copilot abandonne le forfait fixe — et ça change tout pour les équipes

À partir du 1er juin 2026, GitHub Copilot bascule sur une facturation à l'usage. Les Premium Request Units (PRUs) sont remplacés par des GitHub AI Credits directement liés à la consommation de tokens. Les prix de base restent identiques ($10/mois pour Pro, $39/mois pour Pro+), mais les crédits peuvent maintenant être poolés à l'échelle de l'organisation — et les utilisateurs intensifs paieront en conséquence.

Un nouveau plan Copilot Max est également apparu, conçu pour les développeurs en usage intensif soutenu. Microsoft a aussi mis en pause temporaire les inscriptions à Copilot Individual en parallèle de cette annonce — signe que les coûts des workflows agentiques avaient dépassé les projections du modèle forfaitaire.

La raison de fond est simple : les agents qui exécutent des tâches longues et autonomes consomment 10 à 50 fois plus en tokens qu'une simple complétion de code. Un agent qui résout un ticket GitHub en autonomie — lecture du code, exécution de tests, itération — peut consommer 100 000 tokens sur une seule tâche. Au forfait, c'est une perte sèche. Le modèle devait changer.

Claude Code libéré — et Windsurf qui monte en gamme

Claude Code a doublé ses limites d'utilisation sur tous les plans (Pro, Max, Team, Enterprise) le 6 mai. La contrainte des 5 heures par période est passée à 10 heures, et le throttling aux heures de pointe sur Pro et Max a été supprimé. Cette évolution est directement liée à un deal de capacité compute entre Anthropic et SpaceX/Colossus 1 — des ressources supplémentaires qui permettent d'absorber la demande croissante sans dégrader l'expérience.

Pour les équipes qui avaient rationné leur utilisation de Claude Code à cause des plafonds, c'est un signal clair : Anthropic mise sur l'adoption volume, pas sur la restriction comme levier de monétisation. Et pour les développeurs qui alternaient entre Claude Code et d'autres outils pour contourner les limites — le contournement est maintenant superflu.

Windsurf, de son côté, a fait le chemin inverse. Le plan Pro passe de $15 à $20/mois. Un nouveau plan Max est lancé à $200/mois, incluant Devin Cloud et Devin Terminal CLI. Un router adaptatif de modèles est intégré pour diriger automatiquement les requêtes vers le modèle le plus efficace selon la complexité de la tâche. La logique est cohérente : monter en gamme, adresser les équipes qui veulent un environnement de développement IA complet, pas juste un assistant de complétion.

Mon analyse : la fin de la commodité à prix fixe

Ce qui se passe en mai 2026 dans l'espace des coding assistants, c'est la fin de l'illusion du prix fixe. Quand les modèles faisaient de la complétion de code ligne à ligne, un forfait à $10/mois était viable. Quand les mêmes outils exécutent des tâches autonomes pendant des heures, consomment des dizaines de milliers de tokens par session et orchestrent des agents qui font tourner des tests — le forfait devient intenable.

GitHub Copilot le reconnaît formellement au 1er juin. Windsurf le dit implicitement en augmentant ses prix. Cursor répond en maîtrisant ses coûts par le modèle propriétaire. Anthropic investit en capacité compute pour garder Claude Code compétitif sur le volume.

Pour les équipes de développement, le calcul économique s'est inversé. Il faut maintenant choisir un outil en fonction du ratio performance/coût par tâche réelle, pas par mois. Un agent Cursor Composer 2.5 qui résout un bug complexe en 20 minutes coûtera quelques centimes. Le même workflow sur GPT-5.5 en direct coûtera plusieurs euros. Ceux qui continuent à payer le prix fort des modèles closed-source premium pour du coding en 2026 doivent avoir une très bonne raison — confidentialité stricte, cas d'usage où GPT-5.5 se démarque, intégration spécifique.

Pour le reste : les alternatives spécialisées sont arrivées à maturité. Ne pas auditer son stack de coding IA en mai 2026 est une erreur de budget. J'ai comparé les performances et les cas d'intégration de ces outils en détail dans mon analyse complète sur TECH ACTU — le lien est en commentaire.

Partager cet article

À lire aussi en IA & Machine Learning