Si vous evaluez encore le marche des LLM avec le cadre de l'an dernier — juin 2026 impose une relecture complete : retrait de Claude Fable 5 pour controle des exportations, annonces d'IPO chez OpenAI et Anthropic, part des modeles chinois sur OpenRouter depassant 60 %. Ce document s'appuie sur le trafic OpenRouter, l'Artificial Analysis Intelligence Index et SWE-bench Pro pour livrer : (1) classements entreprises et modeles avec chiffres complets ; (2) la chute de 70 % a 30 % des modeles americains en un an ; (3) pourquoi le leader en volume n'est pas le leader en qualite ; (4) une matrice de selection en huit scenarios ; (5) previsions Q3 et cinq tendances macro ; (6) une architecture de routage independante du modele. Il complete la matrice de routage OpenRouter de mai en se concentrant sur les donnees de juin et la strategie S2.
OpenRouter agrege des millions d'appels reels — pas de marketing fabricant, seulement le vote du code. Donnees au juin 2026.
| Rang | Entreprise | Origine | Tokens/semaine | Part de marche |
|---|---|---|---|---|
| 1 | DeepSeek | Chine | 5.13T | 17.6% |
| 2 | Anthropic | Etats-Unis | 4.34T | 14.8% |
| 3 | Etats-Unis | 3.66T | 12.5% | |
| 4 | OpenAI | Etats-Unis | 2.46T | 8.4% |
| 5 | Xiaomi | Chine | 2.42T | 8.3% |
| 6 | MiniMax | Chine | 2.37T | 8.1% |
| 7 | Tencent | Chine | 2.36T | 8.1% |
| 8 | Alibaba Qwen | Chine | 1.26T | 4.3% |
Total modeles chinois : environ 46 % (fabricants chinois du top 10). Les analyses anglophones estiment 61 % du trafic developpeur — ecarts de definition, direction identique.
| Rang | Modele | Fournisseur | Tokens/jour |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Ce classement reflete la confiance des equipes en production, au-dela de la simple popularite.
Donnees Bloomberg / Exponential View via OpenRouter :
40 points de pourcentage migrent vers la Chine — non par preference nationale, mais parce que DeepSeek, Xiaomi et MiniMax sont moins chers, rapides et suffisants.
Temoignage d'un developpeur de San Diego : « Avec Claude, environ 10 USD/heure pour coder. Avec DeepSeek, moins de 50 cents. » — Il s'agit d'economie, pas seulement de benchmarks.
Un ingenieur de Dallas : taches complexes 500 USD/mois Claude + ChatGPT ; 90 % du codage quotidien et de la reconnaissance vocale via MiniMax + Kimi + MiMo pour 200 USD. Approche recommandee : router par complexite, optimiser par cout.
Artificial Analysis Intelligence Index (fin mai 2026) :
| Modele | Indice global | SWE-bench Pro | Remarque |
|---|---|---|---|
| Claude Opus 4.8 | 61.4 (#1) | 69.2% | Long contexte, agents |
| GPT-5.5 | 59–60 | 63.1% | Ecosysteme, tool calls |
| Gemini 3.1 Pro | 57 | — | Raisonnement difficile |
| Qwen 3.7 Max | 57 | — | Flagship chinois ferme |
| Claude Sonnet 4.6 | — | 80.8% (Verified) | Redaction, instructions |
Test pratique sur 20 taches : Opus 4.8 remporte 16, GPT-5.5 5, Gemini 3.1 Pro 4. Le long contexte favorise nettement Opus.
Claude Fable 5 a atteint 100/100 et SWE-bench Verified environ 95 %, puis a ete retire mondialement mi-juin 2026 pour controle des exportations americain — statut incertain. Les modeles americains de pointe restent leaders en capacite pure ; la disponibilite depend de la reglementation. Voir Fable 5 : interdiction et architecture multi-fournisseur.
| Scenario | Modele recommande | Justification |
|---|---|---|
| Code complexe / Agent | Claude Opus 4.8 | Indice #1, long contexte |
| Codage quotidien | DeepSeek V4 Flash / MiMo-V2.5 | Rapport qualite-prix, latence |
| API la plus economique | MiniMax M3 | 0,60 USD/M, poids ouverts |
| Long contexte | Kimi K2.6 (1M) | Fenetre etendue, prix raisonnable |
| Ecosysteme Google | Gemini 3.5 Flash | Integration Workspace |
| Recherche Web temps reel | Grok 4.3 | Contenu X/Twitter en direct |
| Deploiement local | GLM 5.2 / Kimi K2.6 | Meilleurs poids ouverts |
| Generation d'images | ChatGPT Images 2.0 | Rendu texte le plus fiable |
| Dialogue quotidien | GPT-5.5 | 52,5 % d'hallucinations en moins vs GPT-5.3 |
Le T3 2026 pourrait etre le trimestre le plus riche en publications. Previsions a haute confiance :
| Modele | Fournisseur | Fenetre | Points cles |
|---|---|---|---|
| GPT-6 | OpenAI | aout–sept. 2026 | 1,5M contexte (rumeur), agents renforces |
| Claude Opus 5 | Anthropic | vers sept. 2026 | Successeur Opus 4.8, agents longue duree |
| Gemini 4 | T3 2026 | Multimodal, video et audio | |
| DeepSeek V5 | DeepSeek | T3 2026 | Poids ouverts, >1T parametres |
| GLM 5.2 | Z.ai | deja publie | Top poids ouverts, codage |
| Grok 4.3+ | xAI | T3 2026 | 1M contexte, Web temps reel |
GPT-6, Opus 5 et Gemini 4 pourraient arriver dans une fenetre de six semaines entre mi-aout et fin septembre.
x-provider-used et reconciliation quotidienne des couts.DeepSeek en 2025 a demontre qu'un modele de pointe n'exige pas un capex de pointe. Xiaomi, Tencent, MiniMax et Moonshot ont reproduit cette logique — prix plancher.
Reponses americaines : OpenAI ecosysteme ; Anthropic qualite et agents ; Google vitesse et multimodal. La zone « correct mais cher » disparait.
La competence decisive est de construire une architecture interchangeable. Un gateway sur portable echoue face au sommeil et aux reseaux instables — pour un routage agent 7×24, un Mac mini MACCOME dedie (M4 / M4 Pro) reduit le cout total ; tarifs : grille de location, topologie : runbook gateway SSH.
Questions frequentes
Quel modele domine OpenRouter en juin 2026 ?
Quotidiennement : DeepSeek V4 Flash (619B). Hebdomadairement par entreprise : DeepSeek (5,13T, 17,6 %) devant Anthropic (4,34T, 14,8 %). Classement live : OpenRouter Rankings.
DeepSeek est-il meilleur que Claude ?
Selon la tache. Claude Opus 4.8 : indice 61,4, code complexe et agents. DeepSeek V4 Flash : volume et cout. San Diego : Claude ~10 USD/h, DeepSeek <0,50 USD/h. Gateway multi-modeles : tarifs MACCOME.
Quels modeles frontier arrivent au T3 2026 ?
Haute confiance : GPT-6 (aout–sept., rumeur 1,5M contexte), Claude Opus 5 (~sept.), Gemini 4, DeepSeek V5 (poids ouverts, ~1T), Grok 4.3+ (1M). Trois flagships americains possibles en six semaines.
Pourquoi Claude Fable 5 a-t-il ete retire ?
Note 100/100, mais controle des exportations americain mi-juin 2026 — indisponible mondialement. Alternative : Claude Opus 4.8 — voir alternatives Fable 5.