Classements OpenRouter de juin 2026 : les modeles chinois prennent le relais — sur quoi parier au second semestre ?

Environ 22 min de lecture · MACCOME

Si vous evaluez encore le marche des LLM avec le cadre de l'an dernier — juin 2026 impose une relecture complete : retrait de Claude Fable 5 pour controle des exportations, annonces d'IPO chez OpenAI et Anthropic, part des modeles chinois sur OpenRouter depassant 60 %. Ce document s'appuie sur le trafic OpenRouter, l'Artificial Analysis Intelligence Index et SWE-bench Pro pour livrer : (1) classements entreprises et modeles avec chiffres complets ; (2) la chute de 70 % a 30 % des modeles americains en un an ; (3) pourquoi le leader en volume n'est pas le leader en qualite ; (4) une matrice de selection en huit scenarios ; (5) previsions Q3 et cinq tendances macro ; (6) une architecture de routage independante du modele. Il complete la matrice de routage OpenRouter de mai en se concentrant sur les donnees de juin et la strategie S2.

Six erreurs courantes de lecture des classements de juin

  1. Confondre part elevee et superiorite globale : OpenRouter mesure l'usage reel des developpeurs. Les modeles chinois gagnent sur le prix et la latence ; Claude Opus 4.8 conserve l'Intelligence Index 61,4 (#1).
  2. Sous-estimer l'inversion structurelle en douze mois : selon Bloomberg, juin 2025 environ 70 % pour les modeles americains (Google + OpenAI + Anthropic), juin 2026 30 % — 40 points de pourcentage transferes, y compris aupres de developpeurs americains, europeens et indiens.
  3. Interpreter le retrait de Fable 5 comme un recul americain : Fable 5 a obtenu 100/100 — la question est reglementaire, pas technique.
  4. Appliquer un seul leader a tous les cas d'usage : DeepSeek V4 Flash (619B/jour) pour le volume ; les agents complexes restent sur Opus 4.8 — sur 20 taches, Opus 4.8 en remporte 16, GPT-5.5 5, Gemini 3.1 Pro 4.
  5. Ignorer l'impact des IPO sur la tarification : OpenAI et Anthropic ont signale une intention d'IPO en juin 2026 — pression boursiere susceptible d'accelerer la segmentation tarifaire.
  6. Verrouiller un fournisseur unique : cinq laboratoires publieront GPT-6, Claude Opus 5, Gemini 4, DeepSeek V5, etc. en 90 jours — une architecture interchangeable prime sur le « meilleur modele du jour ».

Classements OpenRouter de juin 2026 : entreprises et modeles

OpenRouter agrege des millions d'appels reels — pas de marketing fabricant, seulement le vote du code. Donnees au juin 2026.

Par entreprise (volume hebdomadaire de tokens)

RangEntrepriseOrigineTokens/semainePart de marche
1DeepSeekChine5.13T17.6%
2AnthropicEtats-Unis4.34T14.8%
3GoogleEtats-Unis3.66T12.5%
4OpenAIEtats-Unis2.46T8.4%
5XiaomiChine2.42T8.3%
6MiniMaxChine2.37T8.1%
7TencentChine2.36T8.1%
8Alibaba QwenChine1.26T4.3%

Total modeles chinois : environ 46 % (fabricants chinois du top 10). Les analyses anglophones estiment 61 % du trafic developpeur — ecarts de definition, direction identique.

Par modele (volume quotidien de tokens, top 10)

RangModeleFournisseurTokens/jour
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Ce classement reflete la confiance des equipes en production, au-dela de la simple popularite.

Faits marquants : les modeles americains passent de 70 % a 30 % en un an

Donnees Bloomberg / Exponential View via OpenRouter :

  • Juin 2025 : modeles americains (Google + OpenAI + Anthropic) environ 70 %
  • Juin 2026 : 30 %

40 points de pourcentage migrent vers la Chine — non par preference nationale, mais parce que DeepSeek, Xiaomi et MiniMax sont moins chers, rapides et suffisants.

payments

Temoignage d'un developpeur de San Diego : « Avec Claude, environ 10 USD/heure pour coder. Avec DeepSeek, moins de 50 cents. » — Il s'agit d'economie, pas seulement de benchmarks.

Un ingenieur de Dallas : taches complexes 500 USD/mois Claude + ChatGPT ; 90 % du codage quotidien et de la reconnaissance vocale via MiniMax + Kimi + MiMo pour 200 USD. Approche recommandee : router par complexite, optimiser par cout.

Deux niveaux : volume numero un n'est pas qualite numero un

Plafond qualitatif : Claude Opus 4.8 reste premier

Artificial Analysis Intelligence Index (fin mai 2026) :

ModeleIndice globalSWE-bench ProRemarque
Claude Opus 4.861.4 (#1)69.2%Long contexte, agents
GPT-5.559–6063.1%Ecosysteme, tool calls
Gemini 3.1 Pro57Raisonnement difficile
Qwen 3.7 Max57Flagship chinois ferme
Claude Sonnet 4.680.8% (Verified)Redaction, instructions

Test pratique sur 20 taches : Opus 4.8 remporte 16, GPT-5.5 5, Gemini 3.1 Pro 4. Le long contexte favorise nettement Opus.

Claude Fable 5 a atteint 100/100 et SWE-bench Verified environ 95 %, puis a ete retire mondialement mi-juin 2026 pour controle des exportations americain — statut incertain. Les modeles americains de pointe restent leaders en capacite pure ; la disponibilite depend de la reglementation. Voir Fable 5 : interdiction et architecture multi-fournisseur.

Champions du volume : prix et vitesse

  1. Prix : MiniMax M3 environ 0,60 USD/M en entree — environ 1/8 de Claude Opus 4.8 (5,00 USD/M)
  2. Suffisance : codage quotidien, completion, traduction, resume : 80–90 % de la qualite top
  3. Poids ouverts : DeepSeek V4, MiniMax M3 — deploiement interne pour la confidentialite des donnees

Matrice de selection par scenario (juin 2026)

ScenarioModele recommandeJustification
Code complexe / AgentClaude Opus 4.8Indice #1, long contexte
Codage quotidienDeepSeek V4 Flash / MiMo-V2.5Rapport qualite-prix, latence
API la plus economiqueMiniMax M30,60 USD/M, poids ouverts
Long contexteKimi K2.6 (1M)Fenetre etendue, prix raisonnable
Ecosysteme GoogleGemini 3.5 FlashIntegration Workspace
Recherche Web temps reelGrok 4.3Contenu X/Twitter en direct
Deploiement localGLM 5.2 / Kimi K2.6Meilleurs poids ouverts
Generation d'imagesChatGPT Images 2.0Rendu texte le plus fiable
Dialogue quotidienGPT-5.552,5 % d'hallucinations en moins vs GPT-5.3

Previsions S2 : la saison la plus dense en lancements

Le T3 2026 pourrait etre le trimestre le plus riche en publications. Previsions a haute confiance :

Confirme ou probable (T3 2026)

ModeleFournisseurFenetrePoints cles
GPT-6OpenAIaout–sept. 20261,5M contexte (rumeur), agents renforces
Claude Opus 5Anthropicvers sept. 2026Successeur Opus 4.8, agents longue duree
Gemini 4GoogleT3 2026Multimodal, video et audio
DeepSeek V5DeepSeekT3 2026Poids ouverts, >1T parametres
GLM 5.2Z.aideja publieTop poids ouverts, codage
Grok 4.3+xAIT3 20261M contexte, Web temps reel

GPT-6, Opus 5 et Gemini 4 pourraient arriver dans une fenetre de six semaines entre mi-aout et fin septembre.

Cinq tendances macro

  1. De « qui est le plus fort » a « qui convient au scenario » : cinq lancements en 90 jours — plus de modele unique. Closed source pour les 5 % les plus difficiles, poids ouverts chinois pour les 95 % restants.
  2. Part chinoise en hausse, conformite entreprise comme plafond : croissance chez les developpeurs independants ; achats Fortune 500 contraints par reglementation americaine, residence des donnees et securite supply chain — part entreprise potentiellement sous 30 % malgre 70 %+ chez les indie sur OpenRouter.
  3. Les agents sont le veritable champ de bataille : rapport Anthropic 2026 : 44 % des appels Claude API en maths et informatique.
  4. Double IPO OpenAI + Anthropic : signaux de juin 2026 — tarification plus transparente, guerre des prix possible avec la Chine.
  5. Execution locale >80 % SWE-bench d'ici 2027 : GPU grand public 32 Go devrait atteindre 80 % Verified — pression sur les API de codage quotidien.

Six etapes : architecture de routage independante du modele

  1. Segmenter par complexite : critical (5 %) / standard / bulk — critical vers Opus 4.8 / GPT-5.5, bulk vers DeepSeek V4 Flash / MiniMax M3.
  2. File de repli au gateway : voir routage multi-fournisseur OpenClaw ; degradation automatique sur 429, eviter >60 % de tokens sur un seul fournisseur.
  3. Journalisation : en-tete x-provider-used et reconciliation quotidienne des couts.
  4. Slots A/B pour le T3 : GPT-6, Opus 5, DeepSeek V5 — 48 h apres sortie, 5 % de trafic experimental.
  5. Poids ouverts en secours conformite : DeepSeek V4, Kimi K2.6, GLM 5.2 sur Ollama/vLLM prive.
  6. Revue mensuelle OpenRouter : classements publics vs logs 30 jours — boucle avec la matrice de routage de mai.

Trois indicateurs pour vos OKR

  • Part americaine OpenRouter : 70 % → 30 % (−40 pp), Bloomberg / Exponential View.
  • Ecarts de prix : MiniMax M3 0,60 USD/M vs Opus 4.8 5,00 USD/M (~8x) ; San Diego : Claude 10 USD/h vs DeepSeek <0,50 USD/h.
  • Part agents : 44 % appels Claude maths/CS ; Opus 4.8 SWE-bench Pro 69,2 % ; modeles locaux cible 2027 80 % Verified.

Conclusion : compression des marges, pas seulement « la Chine gagne »

DeepSeek en 2025 a demontre qu'un modele de pointe n'exige pas un capex de pointe. Xiaomi, Tencent, MiniMax et Moonshot ont reproduit cette logique — prix plancher.

Reponses americaines : OpenAI ecosysteme ; Anthropic qualite et agents ; Google vitesse et multimodal. La zone « correct mais cher » disparait.

La competence decisive est de construire une architecture interchangeable. Un gateway sur portable echoue face au sommeil et aux reseaux instables — pour un routage agent 7×24, un Mac mini MACCOME dedie (M4 / M4 Pro) reduit le cout total ; tarifs : grille de location, topologie : runbook gateway SSH.

Questions frequentes

Quel modele domine OpenRouter en juin 2026 ?

Quotidiennement : DeepSeek V4 Flash (619B). Hebdomadairement par entreprise : DeepSeek (5,13T, 17,6 %) devant Anthropic (4,34T, 14,8 %). Classement live : OpenRouter Rankings.

DeepSeek est-il meilleur que Claude ?

Selon la tache. Claude Opus 4.8 : indice 61,4, code complexe et agents. DeepSeek V4 Flash : volume et cout. San Diego : Claude ~10 USD/h, DeepSeek <0,50 USD/h. Gateway multi-modeles : tarifs MACCOME.

Quels modeles frontier arrivent au T3 2026 ?

Haute confiance : GPT-6 (aout–sept., rumeur 1,5M contexte), Claude Opus 5 (~sept.), Gemini 4, DeepSeek V5 (poids ouverts, ~1T), Grok 4.3+ (1M). Trois flagships americains possibles en six semaines.

Pourquoi Claude Fable 5 a-t-il ete retire ?

Note 100/100, mais controle des exportations americain mi-juin 2026 — indisponible mondialement. Alternative : Claude Opus 4.8 — voir alternatives Fable 5.