OpenRouter Juni 2026 im Detail: Chinesische Modelle dominieren — auf wen setzen wir in H2?

Ca. 22 Min. Lesezeit · MACCOME

Wer den LLM-Markt noch mit dem Denkmodell von 2025 liest — der Juni 2026 zwingt zu einer Neubewertung: Claude Fable 5 verschwindet wegen Exportkontrollen, OpenAI und Anthropic signalisieren IPO-Plaene, chinesische Modelle halten auf OpenRouter mehr als 60 % des Developer-Traffics. Dieser Beitrag nutzt OpenRouter-Echtzeitdaten, den Artificial Analysis Intelligence Index und SWE-bench Pro und liefert: (1) vollstaendige Unternehmens- und Modell-Rankings Juni; (2) die Bedeutung des US-Anteils von 70 % auf 30 % in einem Jahr; (3) warum Volumen-Spitze und Qualitaets-Spitze verschiedene Modelle sind; (4) eine Szenario-Matrix in acht Faellen; (5) Q3-Prognosen und fuenf Makrotrends; (6) ein modellunabhaengiges Routing-Design. Ergaenzt die OpenRouter-Routing-Matrix vom Mai — hier stehen Juni-Zahlen und H2-Wettstrategie im Fokus.

Sechs typische Fehlinterpretationen der Juni-Rankings

  1. Hoher Anteil chinesischer Modelle = ueberlegene Gesamtqualitaet: OpenRouter misst reale Developer-Aufrufe. Chinesische Anbieter gewinnen durch Preis und Latenz; Claude Opus 4.8 haelt mit Intelligence Index 61,4 (#1) die Qualitaetsspitze.
  2. Die strukturelle Umkehr innerhalb eines Jahres ignorieren: Bloomberg-Daten: Juni 2025 ca. 70 % US-Modelle (Google + OpenAI + Anthropic), Juni 2026 30 % — 40 Prozentpunkte an China, bei Nutzern aus USA, Europa und Indien.
  3. Fable-5-Delisting als US-Qualitaetsverfall lesen: Fable 5 erreichte 100/100 — US-Spitzenmodelle fuehren rein fachlich; das Delisting ist Exportpolitik, kein Capability-Problem.
  4. Ein Spitzenmodell fuer alle Workloads: DeepSeek V4 Flash (619B/Tag) fuer Bulk; komplexe Agenten weiter zu Opus 4.8 — in 20 Aufgaben gewann Opus 4.8 16, GPT-5.5 5, Gemini 3.1 Pro 4.
  5. IPO-Signale als kurzfristiges Rauschen abtun: OpenAI und Anthropic meldeten im Juni 2026 IPO-Interesse — Boersendruck kann Preisstaffelung beschleunigen und das Preisfenster chinesischer Modelle vergroessern.
  6. Single-Provider-Hardcoding: Fuenf Labore veroeffentlichen in 90 Tagen GPT-6, Claude Opus 5, Gemini 4, DeepSeek V5 u.a. — modellunabhaengiges Routing schlaegt „bestes Modell von heute“.

OpenRouter Juni 2026: Unternehmens- und Modell-Rankings

OpenRouter aggregiert Millionen echter Developer-Aufrufe — kein Marketing, sondern Code als Stimmzettel. Datenstand Juni 2026.

Nach Unternehmen (woechentliches Token-Volumen)

RangUnternehmenHerkunftToken/WocheMarktanteil
1DeepSeekChina5.13T17.6%
2AnthropicUSA4.34T14.8%
3GoogleUSA3.66T12.5%
4OpenAIUSA2.46T8.4%
5XiaomiChina2.42T8.3%
6MiniMaxChina2.37T8.1%
7TencentChina2.36T8.1%
8Alibaba QwenChina1.26T4.3%

Chinesische Anbieter: ca. 46 % (Top-10-China-Hersteller). Englischsprachige Auswertungen nennen 61 % Developer-Traffic — Definitionsunterschiede, gleiche Richtung: China ist OpenRouter-Hauptstrom.

Nach Modell (taegliches Token-Volumen, Top 10)

RangModellAnbieterToken/Tag
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Die Tabelle zeigt nicht nur Popularitaet — sie spiegelt, welchem Modell Produktionssysteme wirklich vertrauen.

Kernbefund: US-Modelle von 70 % auf 30 % in einem Jahr

Bloomberg / Exponential View auf Basis OpenRouter:

  • Juni 2025: US-Modelle (Google + OpenAI + Anthropic) ca. 70 % Token-Anteil
  • Juni 2026: 30 %

40 Prozentpunkte wanderten zu chinesischen Modellen — nicht durch „Patriotismus“, sondern weil DeepSeek, Xiaomi und MiniMax guenstig, schnell und ausreichend gut sind.

payments

Entwickler aus San Diego: „Claude fuer Code ca. 10 USD/Stunde. DeepSeek unter 50 Cent.“ — Das ist Oekonomie, nicht reine Benchmark-Qualitaet.

Ein Engineer aus Dallas: komplexe Tasks 500 USD/Monat Claude + ChatGPT; 90 % Alltags-Coding und Speech mit MiniMax + Kimi + MiMo fuer 200 USD. Playbook: nach Komplexitaet routen, nach Kosten optimieren.

Zwei Ebenen: Volumen-Spitze ist nicht Qualitaets-Spitze

Qualitaet: Claude Opus 4.8 bleibt #1

Artificial Analysis Intelligence Index (Stand Ende Mai 2026):

ModellIntelligence IndexSWE-bench ProAnmerkung
Claude Opus 4.861.4 (#1)69.2%Long Context, Agent-Staerke
GPT-5.559–6063.1%Oekosystem, schnelle Tool-Calls
Gemini 3.1 Pro57Schweres Reasoning
Qwen 3.7 Max57Chinesisches Closed-Source-Flaggschiff
Claude Sonnet 4.680.8% (Verified)Schreiben, Instruction-Following

20 Aufgaben im Praxistest: Opus 4.8 16 Siege, GPT-5.5 5, Gemini 3.1 Pro 4. Long-Context dominiert Opus.

Claude Fable 5 erreichte 100/100 und SWE-bench Verified ca. 95 %, wurde Mitte Juni 2026 wegen US-Exportkontrolle global entfernt — Status offen. Fachlich fuehren US-Topmodelle; Verfuegbarkeit ist policy-bedingt. Details: Fable-5-Sperre und Multi-Provider-Architektur.

Volumen: Chinesische Modelle durch Preis und Tempo

  1. Preis: MiniMax M3 ca. $0.60/M Input — ca. 1/8 von Claude Opus 4.8 ($5.00/M)
  2. Ausreichend: Alltags-Coding, Completion, Uebersetzung, Summary: ca. 80–90 % der Top-Qualitaet
  3. Open Weights: DeepSeek V4, MiniMax M3 — Self-Hosting fuer Datenschutz; unter DSGVO oft der einzige akzeptierte Pfad fuer personenbezogene Produktionsdaten ohne Drittlandtransfer

Szenario-Matrix (Stand Juni 2026)

SzenarioEmpfehlungBegruendung
Komplexer Code / AgentClaude Opus 4.8Index #1, Long Context
Alltags-CodingDeepSeek V4 Flash / MiMo-V2.5Preis-Leistung, Latenz
Guenstigste APIMiniMax M3$0.60/M, Open Weights, Self-Host
Long ContextKimi K2.6 (1M)Sehr langes Fenster, fairer Preis
Google-StackGemini 3.5 FlashWorkspace-Integration
Live-Web-SucheGrok 4.3X/Twitter-Echtzeit
On-Prem / Private CloudGLM 5.2 / Kimi K2.6Top Open Weights
BildgenerierungChatGPT Images 2.0Staerkste Textdarstellung
Alltags-DialogGPT-5.552,5 % weniger Halluzination vs. GPT-5.3

H2-Prognose: das dichteste Release-Fenster

Q3 2026 koennte das release-dichteste Quartal werden. Hohe Konfidenz:

Bestaetigt oder wahrscheinlich (Q3 2026)

ModellAnbieterZeitfensterSchwerpunkt
GPT-6OpenAIAug.–Sept. 20261,5M Context (Geruecht), staerkere Agenten
Claude Opus 5Anthropicca. Sept. 2026Nachfolger Opus 4.8, Long-Agent
Gemini 4GoogleQ3 2026Multimodal, Video/Audio
DeepSeek V5DeepSeekQ3 2026Open Weights, >1T Parameter
GLM 5.2Z.aiveroeffentlichtTop Open Weights, Coding
Grok 4.3+xAIQ3 20261M Context, Live-Web

GPT-6, Opus 5 und Gemini 4 koennten in sechs Wochen Mitte Aug.–Ende Sept. landen — Benchmark-Fuehrung wechselt schneller als Medienzyklen.

Fuenf Makrotrends

  1. Von „wer ist am staerksten“ zu „wer passt zum Szenario“: Fuenf Releases in 90 Tagen — kein einzelner Sieger. Closed Source fuer die haertesten 5 %, chinesische Open Weights fuer 95 % Bulk.
  2. Chinesischer Anteil steigt, Enterprise-Compliance bremst: Indie-Developer weiter nach oben; Fortune-500-Einkauf unter US-Kongressaufsicht, Data Residency und Supply-Chain-Security. In der EU zusaetzlich DSGVO, AV-Vertraege und Verarbeitungsverzeichnis — chinesische SaaS-APIs oft unter 30 % Enterprise-Anteil, trotz 70 %+ bei Indie auf OpenRouter.
  3. Agenten sind das eigentliche Schlachtfeld: Anthropic State of AI Agents 2026: 44 % Claude-API-Calls Mathe/Informatik. Stabile Agent-Pipelines gewinnen.
  4. Doppel-IPO OpenAI + Anthropic: Juni 2026 IPO-Signale — transparentere Preise, moeglicher Preiskrieg mit China.
  5. Lokal >80 % SWE-bench bis 2027: 32-GB-GPU-Consumer-Hardware erreicht voraussichtlich 80 % Verified — Alltags-Coding-APIs unter Druck.

Sechs Schritte: modellunabhaengiges Routing

  1. Task-Buckets: critical (5 %) / standard / bulk — critical zu Opus 4.8 / GPT-5.5, bulk zu DeepSeek V4 Flash / MiniMax M3.
  2. Fallback-Queue im Gateway: siehe OpenClaw Multi-Provider-Routing; bei 429 automatisch degradieren, kein Single-Provider >60 % Token.
  3. Logging: x-provider-used und Tageskosten — „guenstig + 3 Retries“ kann teurer sein als Premium.
  4. A/B-Slots fuer Q3: GPT-6, Opus 5, DeepSeek V5 — 48 h nach Release, 5 % experimental Traffic.
  5. Open Weights als Compliance-Backup: DeepSeek V4, Kimi K2.6, GLM 5.2 auf Ollama/vLLM — DSGVO-konforme Verarbeitung in der EU moeglich.
  6. Monatlicher OpenRouter-Review: oeffentliche Rankings vs. 30-Tage-Logs — gekoppelt an die Mai-Routing-Matrix.

Drei harte KPI-Zahlen fuer OKRs

  • US-Anteil OpenRouter: 70 % → 30 % (−40 pp), Bloomberg / Exponential View — strukturelle Umverteilung.
  • Preisschere: MiniMax M3 $0.60/M vs. Opus 4.8 $5.00/M (~8x); San Diego: Claude $10/h vs. DeepSeek <$0.50/h.
  • Agent-Anteil: 44 % Claude-API Mathe/CS; Opus 4.8 SWE-bench Pro 69.2 %; lokale Modelle 2027 Ziel 80 % Verified.

Fazit: Margenkompression, nicht nur „China gewinnt“

DeepSeek 2025 bewies: Spitzenqualitaet braucht nicht Spitzen-CapEx. Xiaomi, Tencent, MiniMax, Moonshot kopierten — Basispreise am Boden.

US-Reaktion: OpenAI Oekosystem; Anthropic Qualitaet/Agent; Google Speed/Multimodal. Die Mitte „okay aber teuer“ verschwindet.

Wertvoll ist nicht das Modell von heute, sondern Architektur zum Wechseln. Gateway auf Laptop scheitert an Sleep und WLAN — fuer 7×24 Agent-Routing lohnt ein dedizierter MACCOME Mac mini (M4 / M4 Pro); Preise: Mietpreise, Topologie: SSH-Gateway-Runbook.

FAQ

Welches Modell fuehrt OpenRouter im Juni 2026?

Taeglich: DeepSeek V4 Flash (619B). Woechentlich Unternehmen: DeepSeek (5,13T, 17,6 %) vor Anthropic (4,34T, 14,8 %). Live: OpenRouter Rankings.

Ist DeepSeek besser als Claude?

Aufgabenabhaengig. Claude Opus 4.8: Index 61,4, komplexer Code und Agenten. DeepSeek V4 Flash: Volumen und Kosten. San Diego: Claude ~$10/h, DeepSeek <$0,50/h. Multi-Modell-Gateway: MACCOME Mietpreise.

Welche Frontier-Modelle kommen in Q3 2026?

Hohe Konfidenz: GPT-6 (Aug.–Sept., 1,5M Context Geruecht), Claude Opus 5 (~Sept.), Gemini 4, DeepSeek V5 (Open Weights, ~1T), Grok 4.3+ (1M). Drei US-Flaggschiffe moeglicherweise in sechs Wochen.

Warum wurde Claude Fable 5 entfernt?

100/100 Rating, aber US-Exportkontrolle Mitte Juni 2026 — global offline. Ersatz: Claude Opus 4.8 oder Multi-Provider — siehe Fable-5-Alternativen.