昨年の認識のまま AI 大規模モデル市場を読んでいるなら、6月の出来事だけで前提をすべて更新する必要があります:Claude Fable 5 が輸出規制で謎の提供停止、OpenAI と Anthropic が IPO 意向を伝え、中国モデルが OpenRouter のシェアを 60% 超えました。本稿は OpenRouter の実トラフィック、Artificial Analysis Intelligence Index、SWE-bench Pro に基づき、① 6月の会社・モデルランキング全数値、② 米国モデルシェアが1年で 70%→30% となった意味、③「使用量1位」と「品質1位」が別物である理由、④ 8シーン選定早見表、⑤ Q3 リリース予測と5つのマクロトレンド、⑥ ランキングに追随できるモデル非依存アーキテクチャの構築を整理します。5月 OpenRouter ルーティング決定マトリクスと相補的に、本稿は6月最新データと下半期の賭け方に焦点を当てます。
OpenRouter は世界中の数百万開発者の実呼び出し量を集約します。ベンダーの宣伝ではなく、コードによる投票です。下表データは 2026年6月 時点です。
| 順位 | 会社 | 本拠地 | 週トークン量 | シェア |
|---|---|---|---|---|
| 1 | DeepSeek | 🇨🇳 中国 | 5.13T | 17.6% |
| 2 | Anthropic | 🇺🇸 米国 | 4.34T | 14.8% |
| 3 | 🇺🇸 米国 | 3.66T | 12.5% | |
| 4 | OpenAI | 🇺🇸 米国 | 2.46T | 8.4% |
| 5 | 小米 (Xiaomi) | 🇨🇳 中国 | 2.42T | 8.3% |
| 6 | MiniMax | 🇨🇳 中国 | 2.37T | 8.1% |
| 7 | 腾讯 (Tencent) | 🇨🇳 中国 | 2.36T | 8.1% |
| 8 | 阿里 Qwen | 🇨🇳 中国 | 1.26T | 4.3% |
中国モデル合計は約46%(Top 10 内で本拠地が中国と明記されたベンダーのみ集計)。英語圏の集計口径では中国モデルの開発者トラフィックは 61% に達しています——統計口径と未ランクインのベンダーで差はありますが、方向は一致しており、中国陣営が OpenRouter の主力になっています。
| 順位 | モデル | ベンダー | 日次トークン |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | 腾讯 | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | 小米 | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
このランキングの意味は「誰が使われているか」以上に、グローバル開発者が本番環境でどのモデルを信頼しているかを示しています。
Bloomberg が引用した OpenRouter と Exponential View のデータは、次のように整理できます。
失われた40ポイントはすべて中国モデルに移りました。これは国産支持の結果ではありません——OpenRouter のユーザー主体はグローバル開発者です。DeepSeek、小米、MiniMax が選ばれるのは、安く、速く、十分使えるからです。
サンディエゴの開発者の言葉:「Claude でコードを書くと時給およそ 10ドル。DeepSeek なら 50セント 未満。」——これは品質の話ではなく、経済学の話です。
ダラスの別のエンジニアのスタックも典型です:「複雑タスクは月 $500 を Claude + ChatGPT、日常の90%のプログラミングと音声認識は MiniMax + Kimi + MiMo で $200。」プレイブックは 複雑度でルーティング、コストで最適化 です。
Artificial Analysis Intelligence Index(2026年5月末時点)によると:
| モデル | 総合品質指数 | SWE-bench Pro | 備考 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 長コンテキストと Agent で突出 |
| GPT-5.5 | 59–60 | 63.1% | エコシステム最強、ツール呼び出しが最速 |
| Gemini 3.1 Pro | 57 | — | 最難推論タスク向け |
| Qwen 3.7 Max | 57 | — | 中国クローズドソース旗艦 |
| Claude Sonnet 4.6 | — | 80.8%(Verified) | ライティングと指示追従が最良 |
あるエンジニアの20タスク実測では、Claude Opus 4.8 が 16 勝、GPT-5.5 が 5 勝、Gemini 3.1 Pro が 4 勝でした。特に長コンテキストタスクでは Opus が圧倒的です。
Claude Fable 5 も特記事項です——全ランキングで満点品質評価(100/100)、SWE-bench Verified 約 95% を記録しましたが、政府の輸出規制により2026年6月中旬にグローバル提供停止となり、現状は未定です。これは米国トップモデルの純能力が依然として先行していることを示し、利用可能性が政策に制約されているだけです。
中国モデルがこれほど高い使用量シェアを獲得する理由は、次の3点に集約されます。
| シーン | 推奨モデル | 理由 |
|---|---|---|
| 複雑コード / Agent | Claude Opus 4.8 | 総合能力1位、長コンテキストで突出 |
| 日常プログラミング補助 | DeepSeek V4 Flash / MiMo-V2.5 | コスパ極高、速度が速い |
| 超高コスパ API | MiniMax M3 | $0.60/M、オープンウェイト、自前デプロイ可 |
| 長コンテキスト処理 | Kimi K2.6(1M context) | 超長ウィンドウ、価格も妥当 |
| Google エコシステム統合 | Gemini 3.5 Flash | Google Workspace ネイティブ対応 |
| リアルタイム Web 検索 | Grok 4.3 | X/Twitter のリアルタイムコンテンツ取得 |
| ローカル自前デプロイ | GLM 5.2 / Kimi K2.6 | トップクラスのオープンウェイト |
| 画像生成 | ChatGPT Images 2.0 | 文字描画が最強 |
| 日常対話の最適解 | GPT-5.5 | GPT-5.3 比で幻覚52.5%減、エコシステムが充実 |
2026年 Q3 は AI 史上、モデルリリースが最も密集する四半期になる可能性が高いです。現時点で信頼度の高い予測は次のとおりです。
| モデル | ベンダー | 予想時期 | 核心ポイント |
|---|---|---|---|
| GPT-6 | OpenAI | 2026年8–9月 | より長いコンテキスト(噂では1.5M token)、Agent 能力強化 |
| Claude Opus 5 | Anthropic | 2026年9月前後 | Opus 4.8 の後継、長期 Agent タスクを全面強化 |
| Gemini 4 | 2026年 Q3 | マルチモーダル強化、動画理解・音声入力を全面強化 | |
| DeepSeek V5 | DeepSeek | 2026年 Q3 | オープンウェイト、参数量1T超見込み、クローズドソース最前線と対標 |
| GLM 5.2 | Z.ai(智譜) | リリース済み | 現時点のトップオープンウェイトの一つ、プログラミング能力が極めて高い |
| Grok 4.3+ | xAI | 2026年 Q3 | 1M context、リアルタイム Web 強化 |
GPT-6、Claude Opus 5、Gemini 4 など3つの米国旗艦が8月中旬から9月下旬の6週間ウィンドウに集中リリースされる可能性が高く——ベンチマーク首位の入れ替わりは、いかなるメディアサイクルよりも速くなります。
x-provider-used レスポンスヘッダに記録し、日次で照合——「安いモデル + 3回リトライ」の方が高価モデルより高くつく場合があります。本質は AI モデル層の利益が急速に圧縮されている ことです。DeepSeek の2025年初頭の登場は、十分に効率的なアーキテクチャなら最先端モデルに最先端の算力は不要だと証明しました。小米、腾讯、MiniMax、Moonshot がこの結論を迅速に複製し、モデルの「基礎価格」を底値まで押し下げました。
米国ベンダーの対応も分化しています:OpenAI はエコシステム(プラグイン、企業統合、DALL-E、Codex Mobile)に賭け、Anthropic は品質の高地(Claude Opus の Agent 能力)を死守、Google は速度とマルチモーダル(Gemini Flash シリーズは現在最もコスパの高いクローズドソースの一つ)を選びました。中間の「品質は悪くないが高い」ポジションは急速に消えつつあります。
一般の開発者と技術意思決定者にとって今最も価値ある能力は、「最強モデルを選ぶ」ことではなく、いつでもモデルを切り替えられるアーキテクチャを構築することです——今日の1位は、3か月後にはそうでないかもしれません。
マルチモデルルーティング Gateway をノート PC や共用機で動かす場合、フタを閉じたスリープ、ネットワーク揺らぎ、ログ散在が「複雑度ルーティング」を7×24で着地させるのを妨げます。安定した Agent スケジューリングが必要な本番環境では、Gateway を MACCOME Mac mini(M4 / M4 Pro)の独占ノードに置く方が、ローカルで降格キューと格闘するより総コストが低いことが多いです。公開プランはレンタル価格を、トポロジはSSH 常駐 Gateway Runbookを参照してください。
よくある質問
OpenRouter 2026年6月で最も人気の AI モデルはどれですか?
日次トークン量では DeepSeek V4 Flash(619B)が1位です。会社別週次トークン量では DeepSeek(5.13T、17.6%)が Anthropic(4.34T、14.8%)を上回っています。完全なランキングは OpenRouter Rankings をご覧ください。
DeepSeek は Claude より優れていますか?
タスク次第です。Claude Opus 4.8 は Artificial Analysis Intelligence Index で 61.4 点(#1)の総合能力首位で、複雑なコードと長コンテキスト Agent に適しています。DeepSeek V4 Flash は使用量とコスパで圧倒的で、日常プログラミングに向いています。サンディエゴ開発者実測:Claude プログラミング約 $10/時間、DeepSeek は50セント/時間未満。マルチモデルルーティングの実装はMACCOME レンタルプランで7×24 Gateway をデプロイできます。
2026年 Q3 にリリースされる前沿モデルはどれですか?
高信頼度の予測:GPT-6(8–9月、噂では1.5M コンテキスト)、Claude Opus 5(約9月)、Gemini 4(Q3 マルチモーダル強化)、DeepSeek V5(オープンウェイト、~1T パラメータ)、Grok 4.3+(1M context)。米国旗艦3モデルは6週間以内に集中リリースされる可能性が高いです。
Claude Fable 5 はなぜ提供停止されましたか? まだ使えますか?
Fable 5 は 100/100 の品質評価を獲得しましたが、米国政府の輸出規制により2026年6月中旬にグローバル提供停止となり、現状は未定です。代替:複雑タスクは Claude Opus 4.8。コンプライアンス制約がある場合はFable 5 封禁とマルチベンダーアーキテクチャを参照してください。