若你正用去年的认知框架理解 AI 大模型市场——6 月发生的事足以刷新全部假设:Claude Fable 5 因出口管制神秘下架、OpenAI 与 Anthropic 双双传出 IPO 消息、中国模型在 OpenRouter 的份额突破 60%。本文基于 OpenRouter 实时流量、Artificial Analysis Intelligence Index 与 SWE-bench Pro,回答:① 6 月公司榜与模型榜全数字;② 美国模型份额一年从 70% 暴跌到 30% 意味着什么;③「用量第一」与「质量第一」为何不是同一件事;④ 八大场景选型速查;⑤ Q3 发布预测与五条宏观趋势;⑥ 如何构建可随榜单切换的模型无关架构。与5 月 OpenRouter 路由决策矩阵互补——本篇聚焦 6 月最新数据与下半年押注逻辑。
OpenRouter 聚合全球数百万开发者的真实调用量,不靠厂商自吹,只看代码投票。下表数据截至 2026 年 6 月。
| 排名 | 公司 | 来源地 | 周 Token 量 | 市占率 |
|---|---|---|---|---|
| 1 | DeepSeek | 🇨🇳 中国 | 5.13T | 17.6% |
| 2 | Anthropic | 🇺🇸 美国 | 4.34T | 14.8% |
| 3 | 🇺🇸 美国 | 3.66T | 12.5% | |
| 4 | OpenAI | 🇺🇸 美国 | 2.46T | 8.4% |
| 5 | 小米 (Xiaomi) | 🇨🇳 中国 | 2.42T | 8.3% |
| 6 | MiniMax | 🇨🇳 中国 | 2.37T | 8.1% |
| 7 | 腾讯 (Tencent) | 🇨🇳 中国 | 2.36T | 8.1% |
| 8 | 阿里 Qwen | 🇨🇳 中国 | 1.26T | 4.3% |
中国模型合计占比约 46%(仅统计前 10 名内已标注来源的中国厂商)。英文口径下中国模型开发者流量已达 61%——差异来自统计口径与未入榜厂商,但方向一致:中国阵营已成 OpenRouter 主力。
| 排名 | 模型 | 厂商 | 日均 Token |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | 腾讯 | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | 小米 | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
这个榜单的意义远不止「谁用的人多」——它反映的是全球开发者真正在生产环境中信任哪个模型。
Bloomberg 引用的 OpenRouter 与 Exponential View 数据把这件事说得很清楚:
中间那 40 个百分点去哪了?全都被中国模型吃掉了。这不是中国开发者支持国产的结果——OpenRouter 用户主体是全球开发者。他们选择 DeepSeek、小米、MiniMax,是因为这些模型 便宜、够快、够用。
一位圣地亚哥开发者的原话:「用 Claude 写代码,每小时大概花 10 美元。用 DeepSeek,不到 50 美分。」——这不是质量的故事,这是经济学的故事。
达拉斯另一位工程师的栈更典型:「复杂任务每月 $500 给 Claude + ChatGPT,日常 90% 的编程和语音识别用 MiniMax + Kimi + MiMo,只要 $200。」 playbook 就是:按复杂度路由,按成本优化。
根据 Artificial Analysis Intelligence Index(截至 2026 年 5 月底):
| 模型 | 综合质量指数 | SWE-bench Pro | 备注 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 长上下文与 Agent 无敌 |
| GPT-5.5 | 59–60 | 63.1% | 生态最强、工具调用最快 |
| Gemini 3.1 Pro | 57 | — | 最难推理任务 |
| Qwen 3.7 Max | 57 | — | 中国闭源旗舰 |
| Claude Sonnet 4.6 | — | 80.8%(Verified) | 写作与指令遵循最佳 |
一位工程师在实测 20 个任务后的结论:Claude Opus 4.8 赢了 16 个,GPT-5.5 赢了 5 个,Gemini 3.1 Pro 赢了 4 个。特别是长上下文任务,Opus 几乎是碾压级别。
另一个需要特别说明的是 Claude Fable 5——它在所有榜单上拿下满分质量评级(100/100),SWE-bench Verified 约 95%,但因政府出口管制于 2026 年 6 月中旬全球下架,目前状态未定。它的存在说明:美国顶尖模型在纯能力层面仍然领先,只是可及性受政策约束。
中国模型拿到这么高的用量份额,核心逻辑只有三条:
| 场景 | 推荐模型 | 理由 |
|---|---|---|
| 复杂代码 / Agent | Claude Opus 4.8 | 综合能力第一,长上下文无敌 |
| 日常编程辅助 | DeepSeek V4 Flash / MiMo-V2.5 | 性价比极高,速度快 |
| 超高性价比 API | MiniMax M3 | $0.60/M,开放权重,可自部署 |
| 长上下文处理 | Kimi K2.6(1M context) | 超长窗口,价格合理 |
| Google 生态整合 | Gemini 3.5 Flash | Google Workspace 原生支持 |
| 实时 Web 搜索 | Grok 4.3 | X/Twitter 实时内容获取 |
| 自建本地部署 | GLM 5.2 / Kimi K2.6 | 顶级开放权重模型 |
| 图像生成 | ChatGPT Images 2.0 | 文字渲染最强 |
| 最佳日常对话 | GPT-5.5 | 较 GPT-5.3 幻觉减少 52.5%,生态完善 |
Q3 2026 很可能是 AI 史上模型发布最密集的季度。以下是目前最高置信度的预测:
| 模型 | 厂商 | 预计时间 | 核心看点 |
|---|---|---|---|
| GPT-6 | OpenAI | 2026 年 8–9 月 | 更长上下文(传闻 1.5M token),更强 Agent 能力 |
| Claude Opus 5 | Anthropic | 2026 年 9 月前后 | 接棒 Opus 4.8,长程 Agent 任务全面升级 |
| Gemini 4 | 2026 年 Q3 | 多模态升级,视频理解、音频输入全面强化 | |
| DeepSeek V5 | DeepSeek | 2026 年 Q3 | 开放权重,预计参数量破 1T,对标闭源前沿 |
| GLM 5.2 | 智谱 Z.ai | 已发布 | 当前顶级开放权重之一,编程能力极强 |
| Grok 4.3+ | xAI | 2026 年 Q3 | 1M context,增强实时 Web |
其中 GPT-6、Claude Opus 5、Gemini 4 等三款很可能在 8 月中旬至 9 月下旬的六周窗口内集中落地——基准榜首换手速度将快过任何媒体周期。
x-provider-used 响应头,按日对账——「便宜模型 + 重试 3 次」可能比贵模型更贵。这个故事的本质,是 AI 模型层的利润正在被快速压缩。DeepSeek 在 2025 年初的出现,证明了一件事:在足够高效的架构下,顶尖模型不需要顶尖算力。小米、腾讯、MiniMax、Moonshot 迅速复制这一结论,把模型的「基础定价」打到了地板价。
美国厂商的应对策略也因此分化:OpenAI 押注生态(插件、企业集成、DALL-E、Codex Mobile);Anthropic 死守质量高地(Claude Opus 的 Agent 能力确实鹤立鸡群);Google 选择速度和多模态(Gemini Flash 系列是目前性价比最高的闭源选项之一)。中间的「质量不差但价格贵」的位置,正在快速消失。
对于普通开发者和技术决策者来说,现在最值钱的能力,不是「选对最强模型」,而是构建一个能随时切换模型的架构——今天的第一名,三个月后可能就不是了。
若你把多模型路由 Gateway 跑在笔记本或合用机上,合盖睡眠、网络抖动与日志散落会让「按复杂度路由」的策略难以 7×24 落地。对需要稳定 Agent 调度的生产环境,把 Gateway 落在 MACCOME Mac mini(M4 / M4 Pro)独占节点上,通常比在本地与降级队列搏斗更省总成本;公开档位见租赁价格说明,拓扑可参考SSH 常驻 Gateway Runbook。
常见问题
OpenRouter 2026 年 6 月最受欢迎的 AI 模型是哪个?
按日均 Token 量,DeepSeek V4 Flash(619B)位居第一;按公司周 Token 量,DeepSeek(5.13T,17.6%)领先 Anthropic(4.34T,14.8%)。完整榜单见 OpenRouter Rankings。
DeepSeek 比 Claude 更好吗?
取决于任务。Claude Opus 4.8 在 Artificial Analysis Intelligence Index 以 61.4 分居综合能力第一,适合复杂代码与长上下文 Agent;DeepSeek V4 Flash 在用量与性价比上碾压,适合日常编程。圣地亚哥开发者实测:Claude 编程约 $10/小时,DeepSeek 不到 50 美分/小时。落地多模型路由可参考MACCOME 租赁方案部署 7×24 Gateway。
2026 年 Q3 将发布哪些前沿模型?
高置信度预测包括:GPT-6(8–9 月,传闻 1.5M 上下文)、Claude Opus 5(约 9 月)、Gemini 4(Q3 多模态升级)、DeepSeek V5(开放权重、~1T 参数)、Grok 4.3+(1M context)。三款美国旗舰很可能在六周内集中落地。
Claude Fable 5 为什么下架?还能用吗?
Fable 5 曾获 100/100 质量评级,但因美国政府出口管制于 2026 年 6 月中旬全球下架,目前状态未定。替代方案:复杂任务用 Claude Opus 4.8;若受合规限制,可参考本站Fable 5 封禁与多供应商架构一文。