OpenRouter Rankings を開くと、DeepSeek V4 Flash が約 10.9T トークンで首位、腾讯 Hy3 Preview が続き、Owl Alpha と Nemotron 3 Super が $0 単価でトップ10入りしている——本稿はAgent 本番とマルチモデルルーティングを担う開発者・テックリード向けです。① 2026年6月ランキングが示す六大トレンド、② Top モデルの能力・価格の横比較、③ 六つの典型シナリオでの選定、④ OpenClaw / 自前 Gateway への八段階 Runbookを整理します。5月 OpenRouter シェアとルーティングマトリクスと補完関係にあり、本篇はトレンドの進化とシナリオ選定に焦点を当て、token×金額の全文は繰り返しません。
OpenRouter は統一 API 経由の実トークン量を集計するため、ベンダー自報ベンチより「市場の足」に近いです。5月比で6月の構造変化は、中国系オープン MoE が成長率トップを独占、欧米クローズド旗艦は金額高地を維持しつつトークン伸びは鈍化、プラットフォーム自研とチップメーカーの無料モデルがトップ10入りという三点です。以下、総覧表でデータを固定し、六大トレンドと実装手順へ進みます。
下表は 2026年6月4日時点の OpenRouter 排行と公開報道を統合したものです。成長率はプラットフォーム表示の近期トレンドであり、公式ページを正としてください。
| 順位 | モデル | 機関 | 呼び出し(約) | 成長 | 一言 |
|---|---|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 10.9T | ↑995% | 1M コンテキスト、MoE 13B 活性、API 極小コスト |
| 2 | Hy3 Preview | 腾讯 | 10.7T | ↑>999% | オープン MoE、推論 +40%、Agent コーディング強 |
| 3 | Claude Opus 4.7 | Anthropic | 7.48T | ↑197% | 旗艦推論、高解像度ビジョン、長時 Agent 安定 |
| 4 | Claude Sonnet 4.6 | Anthropic | 7.45T | ↑34% | 日常生産の主力、無料枠あり、バランス型 |
| 5 | Owl Alpha | OpenRouter | 5.03T | ↑>999% | 完全無料、1.05M コンテキスト、Agent 向き |
| 6 | Gemini 3 Flash Preview | 4.6T | ↑3% | 全モーダル入力、SWE-bench 78%、Google 連携 | |
| 7 | DeepSeek V4 Pro | DeepSeek | 4.54T | ↑739% | 旗艦 MoE、複雑推論・コーディング SOTA 級 |
| 8 | DeepSeek V3.2 | DeepSeek | 4.31T | ↓14% | 前世代の残量、V4 系列へ置換中 |
| 9 | Kimi K2.6 | Moonshot | 3.72T | ↑1% | 1T MoE、Agent Swarm、長時間無人運転 |
| 10 | Nemotron 3 Super (free) | NVIDIA | 2.65T | ↑3% | 無料オープン、Hybrid Mamba-Transformer、高スループット |
| モデル | 日常 | コード | 長文 | 推論 | マルチモーダル | Agent |
|---|---|---|---|---|---|---|
| DeepSeek V4 Flash | ★★★★★ | ★★★★★ | ★★★★★ | ★★★★★ | — | ★★★★★ |
| Hy3 Preview | ★★★★ | ★★★★★ | ★★★★★ | ★★★★★ | — | ★★★★★ |
| Claude Opus 4.7 | ★★★★ | ★★★★★ | ★★★★★ | ★★★★★ | ★★★★★ | ★★★★★ |
| Claude Sonnet 4.6 | ★★★★★ | ★★★★ | ★★★★★ | ★★★★ | ★★★★ | ★★★★ |
| Owl Alpha | ★★★ | ★★★★ | ★★★★ | ★★★★ | — | ★★★★★ |
| Gemini 3 Flash | ★★★★★ | ★★★★★ | ★★★★★ | ★★★★ | ★★★★★ | ★★★★★ |
| Kimi K2.6 | ★★★★ | ★★★★★ | ★★★★ | ★★★★ | ★★★★ | ★★★★★ |
| Nemotron 3 Super | ★★★★ | ★★★★ | ★★★★★ | ★★★★ | — | ★★★★★ |
| モデル | 入力 $/M | 出力 $/M | コンテキスト | 総パラメータ | オープン |
|---|---|---|---|---|---|
| DeepSeek V4 Flash | ~0.10 | ~0.40 | 1M | 284B MoE | はい |
| DeepSeek V4 Pro | ~0.27 | ~1.10 | 1M | 1.6T MoE | はい |
| Hy3 Preview | 自ホスト中心 | 自ホスト中心 | 256K | 295B MoE | はい |
| Claude Opus 4.7 | 5.00 | 25.00 | 1M β | 非公開 | いいえ |
| Claude Sonnet 4.6 | 3.00 | 15.00 | 200K/1M β | 非公開 | いいえ |
| Owl Alpha | 0 | 0 | 1.05M | 非公開 | いいえ |
| Gemini 3 Flash | 0.50 | 3.00 | 1M+ | 非公開 | いいえ |
| Kimi K2.6 | 低 | 低 | 256K | 1T MoE | はい |
| Nemotron 3 Super | 0 | 0 | 1M | 120B MoE | はい |
価格の注意:上表は執筆時点の OpenRouter / 公式 API 公開単価のオーダーです。週単位で微調整があります。本番は請求書と自前 Gateway ログを正とし、月次予算アラートを必ず設定してください。無料枠の突発スロットリングは Agent チェーン全体を落とします。
DeepSeek V4、Claude Opus 4.7、Owl Alpha、Gemini 3 Flash、Nemotron 3 Super はいずれも 100万級コンテキストを標準仕様にしています。リポジトリ丸ごと、長契約、数週間のセッションログを直接投入できる一方、Gateway ではログ脱敏と截断を強化し、秘密情報を 1M 窓に流し込まない設計が必要です。
DeepSeek(三席)、腾讯 Hy3、Moonshot Kimi などが オープンまたはコミュニティライセンス + MoE 効率で Agent と高並列 API を奪っています。700%〜999% 級の成長は一時的なマーケではなく、開発者のデフォルトルートが書き換わっているサインです。
発表の主役は MMLU から ツール呼び出しの安定性、多段実行、実 GitHub Issue 修復率へ移っています。Kimi K2.6 の Agent Swarm(最大約300サブエージェント、4,000ステップ協調)は競争をオーケストレーション層へ押し上げます。
2026年6月の Top 10 はほぼ MoE または MoE+Mamba ハイブリッドです。Nemotron 3 Super は Hybrid Mamba-Transformer でシーケンス処理を近線形にし、高スループット自ホスト向き。DeepSeek V4 Flash は FP4/FP8 混合精度で長コンテキストコストを抑えます。
Owl Alpha と Nemotron 3 Super(free)は試作・学習・bulk の障壁をゼロにします。企業向けには ゼロ単価≠ゼロリスク——コンプライアンス、ログ保管、SLA、データ越境は別途評価が要ります。
Gemini 3 Flash は画像・音声・動画・PDF を一括入力。Claude Opus 4.7 は高解像度ビジョンと図表 OCR を強調します。企業検索、デザイン稿からコード、運用スクリーンショット分診ではマルチモーダルが必須になっています。
| シナリオ | 第一候補 | 理由 |
|---|---|---|
| 日常業務(文書・翻訳・要約) | Claude Sonnet 4.6 / Gemini 3 Flash | 指示追従が安定、無料・低価格枠で高頻度を吸収 |
| 開発者向けコーディング支援 | DeepSeek V4 Flash / Sonnet 4.6 | 前者は極安+1M でリポジトリ全体、後者は品質が安定 |
| 複雑 Agent / 多段ツールチェーン | Kimi K2.6 / Hy3 / V4 Flash | SWE-bench・Terminal-Bench が強く、オープンで自ホスト可 |
| コスト最優先 | Owl Alpha / Nemotron 3 Super | $0 API。Owl は Stealth 条項と機密データに注意 |
| 画像・動画・図表 | Gemini 3 Flash / Claude Opus 4.7 | 前者は全モーダル、後者は高解像度ビジョン |
| 企業自ホスト高スループット | Nemotron 3 Super / Hy3 / V4 Flash | オープンウェイト可。Nemotron はスループット優位 |
OpenRouter または直契約 API キーがあり、macOS / Linux で Gateway を動かす前提です。構文の詳細はマルチプロバイダールーティングチェックリストを参照し、本篇は戦略層 Runbookのみを扱います。
chat、code、agent-long、vision、bulk の五類に分け、「一モデル万能」を禁止します。code 主用 DeepSeek V4 Flash、降级 Sonnet 4.6。max_tokens と機密フィールド脱敏を維持します。bulk と非機密実験のみ。本番 critical は Stealth 無料にデフォルトしない。openclaw gateway probe 等で、モデル障害とノート PC スリープを区別します。# 例:タスクラベル別ルーティング意図(フィールド名は Gateway 版により異なる)
routing:
code:
primary: deepseek/deepseek-v4-flash
fallback: [anthropic/claude-sonnet-4.6, google/gemini-3-flash-preview]
agent-long:
primary: moonshotai/kimi-k2.6
fallback: [deepseek/deepseek-v4-pro]
vision:
primary: google/gemini-3-flash-preview
fallback: [anthropic/claude-opus-4.7]
bulk-experimental:
primary: openrouter/owl-alpha
allow_sensitive: false
2026年中盤以降、能力の同質化は加速します。1M コンテキスト、MoE、ツール呼び出しは「差別化」から「参入障壁」へ。堀は (1) トークンあたりの算力コスト、(2) エコシステム埋め込み(Cursor / Claude Code、Workspace、Hugging Face 自ホスト)、(3) オープンとクローズドの正面衝突に移ります。
多くのチームにとって今は恩恵期です。無料枠が強く、低価格枠が賢く、高価格枠は長時 Agent でまだ価値があります。四半期にルーティングを見直さないと、「昨年のデフォルト Sonnet」で 5〜10 倍の請求を払い続けるリスクがあります。
マルチモデルルーティングと OpenClaw Gateway を蓋を閉じるノート PCで回す場合、スリープによるルーティング偽死、無料枠スロットリングの連鎖降级、1M ログによるディスク圧迫が隠れコストになります。上文の八段階と 7×24 スケジュール + マルチプロバイダプローブ を本番で動かすなら、MACCOME 専用リモート Mac mini(M4 / M4 Pro)への配置が総コストで有利なことが多いです。公開料金はレンタル料金、トポロジはSSH 常駐 Gateway Runbookと接続できます。
よくある質問
5月の OpenRouter 長文との違いは何ですか?
5月稿はtoken×売上シェア、垂類リーダー、ルーティング決定マトリクスが中心です。本篇は 2026年6月リスト刷新を軸に、六大トレンド + シナリオ選定 + 八段階実装を扱い、Hy3、Owl Alpha、Nemotron 3 Super を追加しています。格局とトレンドの両方を読むことをおすすめします。
無料モデル Owl Alpha を本番に使えますか?
非機密の試作・学習・bulk 向きです。Stealth 条項下で Prompt が改善に使われる可能性があります。本番 critical は有料枠または自ホストオープンウェイトを使い、Gateway で鍵と PII を分離してください。運用・ネットワークはヘルプセンターを参照ください。
ランキングは速く変わります。ルーティングはどの頻度で見直すべきですか?
四半期ごとに OpenRouter Rankings と自社請求を照合することを推奨します。Agent 呼び出しが全体の50%超なら月次で SWE-bench 系タスクをサンプル再検証してください。DeepSeek V4 系列のような大型リリース後は降级チェーンの回帰テストを即実行します。