Если вы все еще мыслите категориями 2025 года — июнь 2026 ломает картину: Claude Fable 5 снят export control'ом, OpenAI и Anthropic намекают на IPO, китайские модели на OpenRouter пробили 60% dev-трафика. Разбор на живых токенах, Artificial Analysis Intelligence Index и SWE-bench Pro: (1) полные company/model rankings за июнь; (2) падение US-доли с 70% до 30% за год; (3) почему volume leader != quality leader; (4) cheat sheet на 8 сценариев; (5) Q3 drop predictions + 5 macro trends; (6) model-agnostic routing architecture. Дополняет майскую routing matrix — здесь свежие июньские цифры и H2 betting logic.
Агрегат миллионов реальных API-вызовов — голосование кодом, не пресс-релизами. Snapshot: июнь 2026.
| # | Компания | Страна | Токены/нед | Доля |
|---|---|---|---|---|
| 1 | DeepSeek | Китай | 5.13T | 17.6% |
| 2 | Anthropic | США | 4.34T | 14.8% |
| 3 | США | 3.66T | 12.5% | |
| 4 | OpenAI | США | 2.46T | 8.4% |
| 5 | Xiaomi | Китай | 2.42T | 8.3% |
| 6 | MiniMax | Китай | 2.37T | 8.1% |
| 7 | Tencent | Китай | 2.36T | 8.1% |
| 8 | Alibaba Qwen | Китай | 1.26T | 4.3% |
CN vendors в сумме ~46% (top-10 CN OEMs). English-language cut дает 61% dev traffic — другой denominator, тот же vector: CN — main stream на OpenRouter.
| # | Модель | Вендор | Токены/день |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Это не popularity contest — это trust signal из prod.
Bloomberg / Exponential View по OpenRouter:
40 pp переехали в CN — не patriotism, а cheap + fast + good enough.
Dev из San Diego: «Claude на код — ~$10/час. DeepSeek — <50 центов.» Это economics, не benchmark war.
Engineer из Dallas: hard tasks — $500/мес Claude+ChatGPT; 90% daily coding/speech через MiniMax+Kimi+MiMo — $200. Playbook: route by complexity, optimize by cost.
Artificial Analysis Intelligence Index (конец мая 2026):
| Модель | Index | SWE-bench Pro | Заметка |
|---|---|---|---|
| Claude Opus 4.8 | 61.4 (#1) | 69.2% | Long context, agents |
| GPT-5.5 | 59–60 | 63.1% | Ecosystem, tool calls |
| Gemini 3.1 Pro | 57 | — | Hard reasoning |
| Qwen 3.7 Max | 57 | — | CN closed flagship |
| Claude Sonnet 4.6 | — | 80.8% (Verified) | Writing, instruction follow |
20-task shootout: Opus 4.8 — 16 wins, GPT-5.5 — 5, Gemini 3.1 Pro — 4. Long context — почти wipe от Opus.
Claude Fable 5: 100/100, SWE-bench Verified ~95%, глобально снят mid-June 2026 из-за US export control — status TBD. US frontier все еще лидирует по raw capability; access — policy layer. См. Fable 5 ban + multi-provider fallback.
| Сценарий | Pick | Почему |
|---|---|---|
| Hard code / Agent | Claude Opus 4.8 | Index #1, long context |
| Daily coding | DeepSeek V4 Flash / MiMo-V2.5 | $/token, latency |
| Cheapest API | MiniMax M3 | $0.60/M, open weights |
| Long context | Kimi K2.6 (1M) | Window + price |
| Google stack | Gemini 3.5 Flash | Workspace native |
| Live web | Grok 4.3 | X/Twitter realtime |
| Self-host | GLM 5.2 / Kimi K2.6 | Top open weights |
| Image gen | ChatGPT Images 2.0 | Text rendering |
| Daily chat | GPT-5.5 | −52.5% hallucination vs GPT-5.3 |
Q3 2026 — плотнейший release window в истории LLM. High-confidence picks:
| Модель | Вендор | ETA | Hook |
|---|---|---|---|
| GPT-6 | OpenAI | авг–сен 2026 | 1.5M context (rumor), stronger agents |
| Claude Opus 5 | Anthropic | ~сен 2026 | Opus 4.8 successor, long agents |
| Gemini 4 | Q3 2026 | Multimodal, video/audio | |
| DeepSeek V5 | DeepSeek | Q3 2026 | Open weights, >1T params |
| GLM 5.2 | Z.ai | shipped | Top open weights, coding |
| Grok 4.3+ | xAI | Q3 2026 | 1M context, live web |
GPT-6, Opus 5, Gemini 4 могут приземлиться в 6-week window mid-Aug – late Sep — leaderboard churn быстрее media cycle.
x-provider-used + daily cost reconcile — «cheap model × 3 retries» может быть дороже premium.DeepSeek в начале 2025 доказал: frontier не требует frontier capex. Xiaomi, Tencent, MiniMax, Moonshot скопировали — floor pricing.
US response split: OpenAI ecosystem play; Anthropic quality/agents moat; Google speed/multimodal. Middle «okay but expensive» исчезает.
Ценность — не угадывать winner модели, а собрать switchable architecture. Gateway на ноутбуке ломается на sleep/Wi-Fi jitter — для 7×24 agent routing дешевле держать MACCOME Mac mini (M4 / M4 Pro) dedicated node; тарифы: цены аренды, topology: SSH gateway runbook.
FAQ
Какая модель лидирует на OpenRouter в июне 2026?
По суточным токенам: DeepSeek V4 Flash (619B). По недельным токенам компании: DeepSeek (5,13T, 17,6%) vs Anthropic (4,34T, 14,8%). Live: OpenRouter Rankings.
DeepSeek лучше Claude?
Зависит от задачи. Claude Opus 4.8 — index 61.4, hard code/agents. DeepSeek V4 Flash — volume/cost. San Diego: Claude ~$10/h, DeepSeek <$0.50/h. Multi-model gateway: тарифы MACCOME.
Какие frontier models в Q3 2026?
High confidence: GPT-6 (авг–сен, rumor 1.5M ctx), Claude Opus 5 (~сен), Gemini 4, DeepSeek V5 (open weights, ~1T), Grok 4.3+ (1M). Три US flagship — возможно за 6 недель.
Почему сняли Claude Fable 5?
100/100 rating, но US export control mid-June 2026 — globally offline. Fallback: Claude Opus 4.8 — см. Fable 5 alternatives.