OpenRouter, июнь 2026: китайские модели захватили роутер — на кого ставить во втором полугодии?

~22 мин чтения · MACCOME

Если вы все еще мыслите категориями 2025 года — июнь 2026 ломает картину: Claude Fable 5 снят export control'ом, OpenAI и Anthropic намекают на IPO, китайские модели на OpenRouter пробили 60% dev-трафика. Разбор на живых токенах, Artificial Analysis Intelligence Index и SWE-bench Pro: (1) полные company/model rankings за июнь; (2) падение US-доли с 70% до 30% за год; (3) почему volume leader != quality leader; (4) cheat sheet на 8 сценариев; (5) Q3 drop predictions + 5 macro trends; (6) model-agnostic routing architecture. Дополняет майскую routing matrix — здесь свежие июньские цифры и H2 betting logic.

Шесть типичных misread'ов июньского топа

  1. «Китай #1 по токенам = #1 по качеству»: OpenRouter — это production traffic, не marketing deck. Китай выигрывает price/latency; Claude Opus 4.8 держит Intelligence Index 61.4 (#1).
  2. Игнор structural flip за 12 месяцев: Bloomberg/OpenRouter: июнь 2025 US (Google+OpenAI+Anthropic) ~70%, июнь 2026 — 30%. Минус 40 pp ушли в CN, при этом юзеры — global devs из US/EU/India.
  3. Fable 5 delist = US models dead: Fable 5 забрал 100/100 — это export policy, не capability regression.
  4. Один winner на все workloads: DeepSeek V4 Flash (619B/day) для bulk; hard agent tasks — Opus 4.8. В бench на 20 задач Opus 4.8 взял 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4.
  5. IPO noise: OpenAI и Anthropic в июне 2026 сигналят IPO — pricing tiers могут ускориться, окно для CN price war расширится.
  6. Hardcode single provider: за 90 дней выходят GPT-6, Opus 5, Gemini 4, DeepSeek V5 — «выбрать лучшую модель» хуже, чем «собрать switchable stack».

OpenRouter июнь 2026: company rank + model rank

Агрегат миллионов реальных API-вызовов — голосование кодом, не пресс-релизами. Snapshot: июнь 2026.

По компаниям (недельные токены)

#КомпанияСтранаТокены/недДоля
1DeepSeekКитай5.13T17.6%
2AnthropicСША4.34T14.8%
3GoogleСША3.66T12.5%
4OpenAIСША2.46T8.4%
5XiaomiКитай2.42T8.3%
6MiniMaxКитай2.37T8.1%
7TencentКитай2.36T8.1%
8Alibaba QwenКитай1.26T4.3%

CN vendors в сумме ~46% (top-10 CN OEMs). English-language cut дает 61% dev traffic — другой denominator, тот же vector: CN — main stream на OpenRouter.

По моделям (суточные токены, top 10)

#МодельВендорТокены/день
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Это не popularity contest — это trust signal из prod.

Main plot: US models 70% → 30% за год

Bloomberg / Exponential View по OpenRouter:

  • Июнь 2025: US stack (Google + OpenAI + Anthropic) ~70%
  • Июнь 2026: 30%

40 pp переехали в CN — не patriotism, а cheap + fast + good enough.

payments

Dev из San Diego: «Claude на код — ~$10/час. DeepSeek — <50 центов.» Это economics, не benchmark war.

Engineer из Dallas: hard tasks — $500/мес Claude+ChatGPT; 90% daily coding/speech через MiniMax+Kimi+MiMo — $200. Playbook: route by complexity, optimize by cost.

Два слоя: volume king != quality king

Quality ceiling: Claude Opus 4.8

Artificial Analysis Intelligence Index (конец мая 2026):

МодельIndexSWE-bench ProЗаметка
Claude Opus 4.861.4 (#1)69.2%Long context, agents
GPT-5.559–6063.1%Ecosystem, tool calls
Gemini 3.1 Pro57Hard reasoning
Qwen 3.7 Max57CN closed flagship
Claude Sonnet 4.680.8% (Verified)Writing, instruction follow

20-task shootout: Opus 4.8 — 16 wins, GPT-5.5 — 5, Gemini 3.1 Pro — 4. Long context — почти wipe от Opus.

Claude Fable 5: 100/100, SWE-bench Verified ~95%, глобально снят mid-June 2026 из-за US export control — status TBD. US frontier все еще лидирует по raw capability; access — policy layer. См. Fable 5 ban + multi-provider fallback.

Volume kings: CN models via price/speed

  1. Price: MiniMax M3 input $0.60/M — ~1/8 от Claude Opus 4.8 ($5.00/M)
  2. Good enough: daily coding, completion, translate, summary — 80–90% top-tier quality
  3. Open weights: DeepSeek V4, MiniMax M3 — self-host, zero data egress paranoia

Scenario cheat sheet (июнь 2026)

СценарийPickПочему
Hard code / AgentClaude Opus 4.8Index #1, long context
Daily codingDeepSeek V4 Flash / MiMo-V2.5$/token, latency
Cheapest APIMiniMax M3$0.60/M, open weights
Long contextKimi K2.6 (1M)Window + price
Google stackGemini 3.5 FlashWorkspace native
Live webGrok 4.3X/Twitter realtime
Self-hostGLM 5.2 / Kimi K2.6Top open weights
Image genChatGPT Images 2.0Text rendering
Daily chatGPT-5.5−52.5% hallucination vs GPT-5.3

H2 forecast: model drop season

Q3 2026 — плотнейший release window в истории LLM. High-confidence picks:

Confirmed / likely (Q3 2026)

МодельВендорETAHook
GPT-6OpenAIавг–сен 20261.5M context (rumor), stronger agents
Claude Opus 5Anthropic~сен 2026Opus 4.8 successor, long agents
Gemini 4GoogleQ3 2026Multimodal, video/audio
DeepSeek V5DeepSeekQ3 2026Open weights, >1T params
GLM 5.2Z.aishippedTop open weights, coding
Grok 4.3+xAIQ3 20261M context, live web

GPT-6, Opus 5, Gemini 4 могут приземлиться в 6-week window mid-Aug – late Sep — leaderboard churn быстрее media cycle.

Пять macro trends

  1. Ось «кто сильнейший» → «кто под сценарий»: 5 drops за 90 дней — single king dead. Closed frontier на hardest 5%, CN open weights на остальные 95%.
  2. CN share растет, enterprise compliance — ceiling: indie devs → 70%+ на OpenRouter возможно; Fortune 500 procurement под US Congress, data residency, supply chain — enterprise share может остаться <30%.
  3. Agents — real battlefield: Anthropic State of AI Agents 2026: 44% Claude API calls — math/CS. Stable agent pipelines win.
  4. Dual IPO OpenAI + Anthropic: июнь 2026 signals — прозрачнее pricing, price war с CN.
  5. Local >80% SWE-bench к 2027: consumer GPU 32GB пробьет 80% Verified — daily coding API market under siege.

Six-step: model-agnostic routing stack

  1. Bucket by complexity: critical (5%) / standard / bulk — critical → Opus 4.8 / GPT-5.5, bulk → DeepSeek V4 Flash / MiniMax M3.
  2. Fallback queue в gateway: см. OpenClaw multi-provider routing; auto-degrade на 429, no single provider >60% tokens.
  3. Telemetry: header x-provider-used + daily cost reconcile — «cheap model × 3 retries» может быть дороже premium.
  4. A/B slots под Q3: GPT-6, Opus 5, DeepSeek V5 — через 48h после релиза, 5% experimental traffic.
  5. Open weights как compliance backup: DeepSeek V4, Kimi K2.6, GLM 5.2 на private Ollama/vLLM.
  6. Monthly OpenRouter review: public rankings vs ваши 30-day logs — loop с майской routing matrix.

Три hard numbers для OKR

  • US OpenRouter share: 70% → 30% (−40 pp), Bloomberg / Exponential View — structural reshuffle.
  • Price gap: MiniMax M3 $0.60/M vs Opus 4.8 $5.00/M (~8×); San Diego: Claude $10/h vs DeepSeek <$0.50/h.
  • Agent share: 44% Claude API math/CS; Opus 4.8 SWE-bench Pro 69.2%; local models target 2027 80% Verified.

Bottom line: margin compression, not just «CN wins»

DeepSeek в начале 2025 доказал: frontier не требует frontier capex. Xiaomi, Tencent, MiniMax, Moonshot скопировали — floor pricing.

US response split: OpenAI ecosystem play; Anthropic quality/agents moat; Google speed/multimodal. Middle «okay but expensive» исчезает.

Ценность — не угадывать winner модели, а собрать switchable architecture. Gateway на ноутбуке ломается на sleep/Wi-Fi jitter — для 7×24 agent routing дешевле держать MACCOME Mac mini (M4 / M4 Pro) dedicated node; тарифы: цены аренды, topology: SSH gateway runbook.

FAQ

Какая модель лидирует на OpenRouter в июне 2026?

По суточным токенам: DeepSeek V4 Flash (619B). По недельным токенам компании: DeepSeek (5,13T, 17,6%) vs Anthropic (4,34T, 14,8%). Live: OpenRouter Rankings.

DeepSeek лучше Claude?

Зависит от задачи. Claude Opus 4.8 — index 61.4, hard code/agents. DeepSeek V4 Flash — volume/cost. San Diego: Claude ~$10/h, DeepSeek <$0.50/h. Multi-model gateway: тарифы MACCOME.

Какие frontier models в Q3 2026?

High confidence: GPT-6 (авг–сен, rumor 1.5M ctx), Claude Opus 5 (~сен), Gemini 4, DeepSeek V5 (open weights, ~1T), Grok 4.3+ (1M). Три US flagship — возможно за 6 недель.

Почему сняли Claude Fable 5?

100/100 rating, но US export control mid-June 2026 — globally offline. Fallback: Claude Opus 4.8 — см. Fable 5 alternatives.