若你正用去年的認知框架理解 AI 大模型市場——6 月發生的事足以刷新全部假設:Claude Fable 5 因出口管制神秘下架、OpenAI 與 Anthropic 雙雙傳出 IPO 消息、中國模型在 OpenRouter 的份額突破 60%。本文依 OpenRouter 即時流量、Artificial Analysis Intelligence Index 與 SWE-bench Pro,回答:① 6 月公司榜與模型榜全數字;② 美國模型份額一年從 70% 暴跌到 30% 意味著什麼;③「用量第一」與「品質第一」為何不是同一件事;④ 八大場景選型速查;⑤ Q3 發布預測與五條宏觀趨勢;⑥ 如何建構可隨榜單切換的模型無關架構。與5 月 OpenRouter 路由決策矩陣互補——本篇聚焦 6 月最新資料與下半年押注邏輯。
OpenRouter 聚合全球數百萬開發者的真實呼叫量,不靠廠商自吹,只看程式碼投票。下表資料截至 2026 年 6 月。
| 排名 | 公司 | 來源地 | 週 Token 量 | 市占率 |
|---|---|---|---|---|
| 1 | DeepSeek | 中國 | 5.13T | 17.6% |
| 2 | Anthropic | 美國 | 4.34T | 14.8% |
| 3 | 美國 | 3.66T | 12.5% | |
| 4 | OpenAI | 美國 | 2.46T | 8.4% |
| 5 | 小米 (Xiaomi) | 中國 | 2.42T | 8.3% |
| 6 | MiniMax | 中國 | 2.37T | 8.1% |
| 7 | 騰訊 (Tencent) | 中國 | 2.36T | 8.1% |
| 8 | 阿里 Qwen | 中國 | 1.26T | 4.3% |
中國模型合計占比約 46%(僅統計前 10 名內已標註來源的中國廠商)。英文口徑下中國模型開發者流量已達 61%——差異來自統計口徑與未入榜廠商,但方向一致:中國陣營已成 OpenRouter 主力。
| 排名 | 模型 | 廠商 | 日均 Token |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | 騰訊 | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | 小米 | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
這個榜單的意義遠不止「誰用的人多」——它反映的是全球開發者真正在生產環境中信任哪個模型。
Bloomberg 引用的 OpenRouter 與 Exponential View 資料把這件事說得很清楚:
中間那 40 個百分點去哪了?全都被中國模型吃掉了。這不是中國開發者支持國產的結果——OpenRouter 使用者主體是全球開發者。他們選擇 DeepSeek、小米、MiniMax,是因為這些模型 便宜、夠快、夠用。
一位聖地牙哥開發者的原話:「用 Claude 寫程式碼,每小時大概花 10 美元。用 DeepSeek,不到 50 美分。」——這不是品質的故事,這是經濟學的故事。
達拉斯另一位工程師的技術棧更典型:「複雜任務每月 $500 給 Claude + ChatGPT,日常 90% 的程式設計與語音辨識用 MiniMax + Kimi + MiMo,只要 $200。」 playbook 就是:依複雜度路由,依成本最佳化。
根據 Artificial Analysis Intelligence Index(截至 2026 年 5 月底):
| 模型 | 綜合品質指數 | SWE-bench Pro | 備註 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 長上下文與 Agent 無敵 |
| GPT-5.5 | 59–60 | 63.1% | 生態最強、工具呼叫最快 |
| Gemini 3.1 Pro | 57 | — | 最難推理任務 |
| Qwen 3.7 Max | 57 | — | 中國閉源旗艦 |
| Claude Sonnet 4.6 | — | 80.8%(Verified) | 寫作與指令遵循最佳 |
一位工程師在實測 20 個任務後的結論:Claude Opus 4.8 贏了 16 個,GPT-5.5 贏了 5 個,Gemini 3.1 Pro 贏了 4 個。特別是長上下文任務,Opus 幾乎是碾壓級別。
另一個需要特別說明的是 Claude Fable 5——它在所有榜單上拿下滿分品質評級(100/100),SWE-bench Verified 約 95%,但因政府出口管制於 2026 年 6 月中旬全球下架,目前狀態未定。它的存在說明:美國頂尖模型在純能力層面仍然領先,只是可及性受政策約束。
中國模型拿到這麼高的用量份額,核心邏輯只有三條:
| 場景 | 推薦模型 | 理由 |
|---|---|---|
| 複雜程式碼 / Agent | Claude Opus 4.8 | 綜合能力第一,長上下文無敵 |
| 日常程式設計輔助 | DeepSeek V4 Flash / MiMo-V2.5 | 性價比極高,速度快 |
| 超高性價比 API | MiniMax M3 | $0.60/M,開放權重,可自部署 |
| 長上下文處理 | Kimi K2.6(1M context) | 超長視窗,價格合理 |
| Google 生態整合 | Gemini 3.5 Flash | Google Workspace 原生支援 |
| 即時 Web 搜尋 | Grok 4.3 | X/Twitter 即時內容取得 |
| 自建本地部署 | GLM 5.2 / Kimi K2.6 | 頂級開放權重模型 |
| 影像生成 | ChatGPT Images 2.0 | 文字渲染最強 |
| 最佳日常對話 | GPT-5.5 | 較 GPT-5.3 幻覺減少 52.5%,生態完善 |
Q3 2026 很可能是 AI 史上模型發布最密集的季度。以下是目前最高置信度的預測:
| 模型 | 廠商 | 預計時間 | 核心看點 |
|---|---|---|---|
| GPT-6 | OpenAI | 2026 年 8–9 月 | 更長上下文(傳聞 1.5M token),更強 Agent 能力 |
| Claude Opus 5 | Anthropic | 2026 年 9 月前後 | 接棒 Opus 4.8,長程 Agent 任務全面升級 |
| Gemini 4 | 2026 年 Q3 | 多模態升級,影片理解、音訊輸入全面強化 | |
| DeepSeek V5 | DeepSeek | 2026 年 Q3 | 開放權重,預計參數量破 1T,對標閉源前沿 |
| GLM 5.2 | 智譜 Z.ai | 已發布 | 當前頂級開放權重之一,程式設計能力極強 |
| Grok 4.3+ | xAI | 2026 年 Q3 | 1M context,增強即時 Web |
其中 GPT-6、Claude Opus 5、Gemini 4 等三款很可能在 8 月中旬至 9 月下旬的六週窗口內集中落地——基準榜首換手速度將快過任何媒體週期。
x-provider-used 回應標頭,依日對帳——「便宜模型 + 重試 3 次」可能比貴模型更貴。這個故事的本質,是 AI 模型層的利潤正在被快速壓縮。DeepSeek 在 2025 年初的出現,證明了一件事:在足夠高效的架構下,頂尖模型不需要頂尖算力。小米、騰訊、MiniMax、Moonshot 迅速複製這一結論,把模型的「基礎定價」打到了地板價。
美國廠商的應對策略也因此分化:OpenAI 押注生態(外掛、企業整合、DALL-E、Codex Mobile);Anthropic 死守品質高地(Claude Opus 的 Agent 能力確實鶴立雞群);Google 選擇速度和多模態(Gemini Flash 系列是目前性價比最高的閉源選項之一)。中間的「品質不差但價格貴」的位置,正在快速消失。
對於普通開發者和技術決策者來說,現在最值錢的能力,不是「選對最強模型」,而是建構一個能隨時切換模型的架構——今天的第一名,三個月後可能就不是了。
若你把多模型路由 Gateway 跑在筆電或合用機上,合蓋睡眠、網路抖動與日誌散落會讓「依複雜度路由」的策略難以 7×24 落地。對需要穩定 Agent 調度的生產環境,把 Gateway 落在 MACCOME Mac mini(M4 / M4 Pro)獨占節點上,通常比在本地與降級佇列搏鬥更省總成本;公開檔位見租用價格說明,拓撲可參考SSH 常駐 Gateway Runbook。
常見問題
OpenRouter 2026 年 6 月最受歡迎的 AI 模型是哪個?
依日均 Token 量,DeepSeek V4 Flash(619B)位居第一;依公司週 Token 量,DeepSeek(5.13T,17.6%)領先 Anthropic(4.34T,14.8%)。完整榜單見 OpenRouter Rankings。
DeepSeek 比 Claude 更好嗎?
取決於任務。Claude Opus 4.8 在 Artificial Analysis Intelligence Index 以 61.4 分居綜合能力第一,適合複雜程式碼與長上下文 Agent;DeepSeek V4 Flash 在用量與性價比上碾壓,適合日常程式設計。聖地牙哥開發者實測:Claude 程式設計約 $10/小時,DeepSeek 不到 50 美分/小時。落地多模型路由可參考MACCOME 租用方案部署 7×24 Gateway。
2026 年 Q3 將發布哪些前沿模型?
高置信度預測包括:GPT-6(8–9 月,傳聞 1.5M 上下文)、Claude Opus 5(約 9 月)、Gemini 4(Q3 多模態升級)、DeepSeek V5(開放權重、~1T 參數)、Grok 4.3+(1M context)。三款美國旗艦很可能在六週內集中落地。
Claude Fable 5 為什麼下架?還能用嗎?
Fable 5 曾獲 100/100 品質評級,但因美國政府出口管制於 2026 年 6 月中旬全球下架,目前狀態未定。替代方案:複雜任務用 Claude Opus 4.8;若受合規限制,可參考本站Fable 5 封禁與多供應商架構一文。