Qwen 3.7 Max : Alibaba ferme ses modeles et sort sa puce

Pendant deux ans, Alibaba a ete le visage de l'IA chinoise open source : la famille Qwen, telechargee des dizaines de millions de fois, est devenue la base de milliers de projets dans le monde. Avec le lancement de Qwen 3.7 Max, annonce autour du 20 mai 2026 au Alibaba Cloud Summit de Hangzhou, l'entreprise opere un virage que peu avaient anticipe : son modele le plus puissant ne sera pas ouvert. Et ce n'est pas la seule surprise.

Qwen 3.7 Max, nouveau roi chinois de l'Arena

Les versions preview de Qwen 3.7 sont d'abord apparues discretement sur le classement public LMArena a la mi-mai, sans communique. Quelques jours plus tard, Alibaba officialisait la gamme lors de son sommet annuel.

Sur l'Arena, Qwen3.7-Max se hisse au 13e rang mondial en capacites texte (7e en mathematiques, 9e en code), et Qwen3.7-Plus au 16e rang en vision. Ce sont, a ce jour, les modeles chinois les mieux classes, devant tous les autres laboratoires du pays.

Cote benchmarks techniques, les chiffres revendiques sont serieux : 92,4 sur GPQA Diamond, 80,4 sur SWE-bench Verified, 60,6 sur le plus dur SWE-bench Pro et 69,7 sur Terminal-Bench 2.0. Alibaba met aussi en avant une demonstration d'agent autonome qui a tourne 35 heures d'affilee en enchainant 1 158 appels d'outils pour optimiser du code GPU. Le modele embarque une fenetre de contexte annoncee a 1 million de tokens.

Le virage que personne n'attendait : Alibaba ferme ses modeles

Voici le vrai sujet. Qwen 3.7 Max est proprietaire, en poids fermes, accessible uniquement via API payante sur Alibaba Cloud Model Studio (et des plateformes comme OpenRouter ou Together AI). Aucun fichier de poids a telecharger, contrairement a ce qui a fait la reputation de Qwen.

Ce n'est pas un accident isole : les precedents Qwen3.6-Max et Plus etaient deja restes fermes. Autrement dit, Alibaba reserve desormais ses modeles de pointe au payant, tout en continuant a publier des versions plus petites en open weight pour entretenir l'ecosysteme.

La logique est limpide : monetiser. Quand on a la meilleure techno chinoise, on ne la donne plus gratuitement. C'est exactement la trajectoire qu'avait prise OpenAI il y a quelques annees, et c'est un signal fort sur la maturite economique du secteur chinois.

La vraie nouvelle est peut-etre dans le silicium

Le meme jour que Qwen 3.7, Alibaba a devoile une puce d'IA maison via sa filiale T-Head : la Zhenwu M890. Au menu, 144 Go de memoire, 800 Go/s de bande passante inter-puces et un gain annonce de 3x sur la generation precedente. Un serveur Panjiu peut en aligner 128 par rack.

Coupler la sortie d'un modele frontiere avec celle de son propre accelerateur n'a rien d'anodin. Sous le coup des restrictions americaines sur les puces Nvidia haut de gamme, les geants chinois cherchent a tenir toute la chaine : le modele, le cloud et le materiel qui le fait tourner.

Si Alibaba parvient a entrainer et servir Qwen sur son propre silicium a grande echelle, l'argument commercial devient redoutable pour le marche asiatique : une IA performante, hebergee localement, sans dependance a une chaine d'approvisionnement sous embargo.

Faut-il vraiment crier au sorpasso ?

Un peu de mesure s'impose. Malgre des benchmarks flatteurs, le South China Morning Post rappelle que les previews Qwen 3.7 restent derriere les references occidentales sur l'Arena : Claude d'Anthropic, Gemini de Google et GPT d'OpenAI conservent le haut du classement generaliste.

13e mondial, c'est excellent pour un modele chinois, mais ce n'est pas la premiere place. Les scores de benchmarks maison sont par ailleurs a prendre avec prudence tant qu'ils ne sont pas reproduits par des tiers independants.

Reste un argument qui, lui, ne se discute pas : le prix. Qwen 3.7 Max serait facture autour de 2,50 $ en entree et 7,50 $ en sortie par million de tokens, soit grosso modo la moitie du tarif d'un Claude Opus de derniere generation. Pour un niveau de performance proche sur beaucoup de taches, l'ecart de cout devient un vrai critere.

Mon analyse

Ce lancement raconte deux histoires en une. La premiere, c'est la fin de l'innocence open source chez Alibaba : le meilleur de Qwen passe au payant, signe que l'IA chinoise entre dans sa phase de rentabilisation. La seconde, plus structurante, c'est l'integration verticale modele + puce pour s'affranchir des restrictions americaines.

Pour les decideurs europeens, je retiens surtout ceci : la concurrence sur les LLM ne se joue plus seulement sur le score brut, mais sur le rapport performance/prix et sur la souverainete de la chaine technique. Un modele 13e mondial a moitie prix, c'est une option credible pour beaucoup d'usages metier, a condition d'accepter de faire transiter ses donnees par un cloud chinois - ce qui, pour des donnees sensibles, reste un vrai point de vigilance.

Alibaba ne cherche pas a battre Claude ou GPT frontalement. Il construit une offre moins chere, integree de bout en bout et independante de Nvidia. Sur le long terme, c'est peut-etre une menace plus serieuse qu'un simple record de benchmark. J'ai detaille les chiffres, les benchmarks et les implications pour les equipes tech dans mon analyse complete sur TECH ACTU - le lien est en commentaire.

Qwen 3.7 Max : Alibaba ferme ses modeles et sort sa puce

Qwen 3.7 Max, nouveau roi chinois de l'Arena

Le virage que personne n'attendait : Alibaba ferme ses modeles

La vraie nouvelle est peut-etre dans le silicium

Faut-il vraiment crier au sorpasso ?

Mon analyse

Partager cet article

À lire aussi en IA & Machine Learning

MAI-Code-1-Flash : Microsoft veut coder sans OpenAI

Kimi K2.7-Code : l'IA chinoise de Moonshot taillee pour les agents

DiffusionGemma : Google génère du texte 4x plus vite, autrement

Fable 5 : quand l'Etat peut debrancher un modele d'IA en une nuit

Qwen 3.7 Max : Alibaba ferme ses modeles et sort sa puce

Qwen 3.7 Max, nouveau roi chinois de l'Arena

Le virage que personne n'attendait : Alibaba ferme ses modeles

La vraie nouvelle est peut-etre dans le silicium

Faut-il vraiment crier au sorpasso ?

Mon analyse

Partager cet article

Termes du glossaire liés

À lire aussi en IA & Machine Learning

MAI-Code-1-Flash : Microsoft veut coder sans OpenAI

Kimi K2.7-Code : l'IA chinoise de Moonshot taillee pour les agents

DiffusionGemma : Google génère du texte 4x plus vite, autrement

Fable 5 : quand l'Etat peut debrancher un modele d'IA en une nuit