6月AI模型排行榜深度分析:中国模型「接管」OpenRouter,下半年我们该押注谁?

约 22 分钟阅读 · MACCOME

若你正用去年的认知框架理解 AI 大模型市场——6 月发生的事足以刷新全部假设:Claude Fable 5 因出口管制神秘下架、OpenAI 与 Anthropic 双双传出 IPO 消息、中国模型在 OpenRouter 的份额突破 60%。本文基于 OpenRouter 实时流量、Artificial Analysis Intelligence Index 与 SWE-bench Pro,回答:① 6 月公司榜与模型榜全数字;② 美国模型份额一年从 70% 暴跌到 30% 意味着什么;③「用量第一」与「质量第一」为何不是同一件事;④ 八大场景选型速查;⑤ Q3 发布预测与五条宏观趋势;⑥ 如何构建可随榜单切换的模型无关架构。与5 月 OpenRouter 路由决策矩阵互补——本篇聚焦 6 月最新数据与下半年押注逻辑

六种常见的「6 月榜单误读」(先认清再谈押注)

  1. 把中国模型高份额等同于「质量全面超越」:OpenRouter 反映的是全球开发者真实调用量,中国模型赢的是性价比与速度,Claude Opus 4.8 仍以 Intelligence Index 61.4(#1) 守住质量高地。
  2. 忽视一年内的结构性反转:Bloomberg 引用数据显示,2025 年 6 月美国模型(Google + OpenAI + Anthropic)占 OpenRouter 约 70%,2026 年 6 月跌至 30%——40 个百分点被中国模型吃掉,且用户主体含大量美国、欧洲、印度开发者。
  3. 把 Fable 5 下架当作美国模型衰落:Fable 5 曾拿下满分 100/100 质量评级,恰恰证明美国顶尖模型在纯能力层面仍领先;下架是出口管制政策问题,不是能力问题。
  4. 用单一榜首覆盖所有场景:日均 Token 第一的 DeepSeek V4 Flash(619B)适合日常量;复杂 Agent 仍应路由到 Opus 4.8——一位工程师实测 20 个任务,Opus 4.8 赢 16 个,GPT-5.5 赢 5 个,Gemini 3.1 Pro 赢 4 个。
  5. 忽视 IPO 对定价的长期影响:OpenAI 与 Anthropic 均于 2026 年 6 月传出 IPO 意向,上市压力可能加速分层定价,间接利好中国模型的价格战窗口。
  6. 硬编码单一 provider:Q3 五大实验室将在 90 天内密集发布——GPT-6、Claude Opus 5、Gemini 4、DeepSeek V5 等——今天的第一名三个月后可能换位;「选对最强模型」不如「构建能随时切换的架构」。

OpenRouter 6 月榜单全解析:公司排名与模型排名

OpenRouter 聚合全球数百万开发者的真实调用量,不靠厂商自吹,只看代码投票。下表数据截至 2026 年 6 月

按公司排名(周 Token 量)

排名公司来源地周 Token 量市占率
1DeepSeek🇨🇳 中国5.13T17.6%
2Anthropic🇺🇸 美国4.34T14.8%
3Google🇺🇸 美国3.66T12.5%
4OpenAI🇺🇸 美国2.46T8.4%
5小米 (Xiaomi)🇨🇳 中国2.42T8.3%
6MiniMax🇨🇳 中国2.37T8.1%
7腾讯 (Tencent)🇨🇳 中国2.36T8.1%
8阿里 Qwen🇨🇳 中国1.26T4.3%

中国模型合计占比约 46%(仅统计前 10 名内已标注来源的中国厂商)。英文口径下中国模型开发者流量已达 61%——差异来自统计口径与未入榜厂商,但方向一致:中国阵营已成 OpenRouter 主力。

按模型排名(日均 Token 量 Top 10)

排名模型厂商日均 Token
1DeepSeek V4 FlashDeepSeek619B
2Hy3 Preview腾讯451B
3MiniMax M3MiniMax447B
4MiMo-V2.5小米327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

这个榜单的意义远不止「谁用的人多」——它反映的是全球开发者真正在生产环境中信任哪个模型。

最大的故事:一年之内,美国模型从 70% 暴跌到 30%

Bloomberg 引用的 OpenRouter 与 Exponential View 数据把这件事说得很清楚:

  • 2025 年 6 月:美国模型(Google + OpenAI + Anthropic 合计)占 OpenRouter 约 70% 的 Token 份额
  • 2026 年 6 月:这个数字跌到了 30%

中间那 40 个百分点去哪了?全都被中国模型吃掉了。这不是中国开发者支持国产的结果——OpenRouter 用户主体是全球开发者。他们选择 DeepSeek、小米、MiniMax,是因为这些模型 便宜、够快、够用

payments

一位圣地亚哥开发者的原话:「用 Claude 写代码,每小时大概花 10 美元。用 DeepSeek,不到 50 美分。」——这不是质量的故事,这是经济学的故事。

达拉斯另一位工程师的栈更典型:「复杂任务每月 $500 给 Claude + ChatGPT,日常 90% 的编程和语音识别用 MiniMax + Kimi + MiMo,只要 $200。」 playbook 就是:按复杂度路由,按成本优化

分层理解:「用量第一」≠「质量第一」

质量天花板:Claude Opus 4.8 仍是综合能力第一

根据 Artificial Analysis Intelligence Index(截至 2026 年 5 月底):

模型综合质量指数SWE-bench Pro备注
Claude Opus 4.861.4(#1)69.2%长上下文与 Agent 无敌
GPT-5.559–6063.1%生态最强、工具调用最快
Gemini 3.1 Pro57最难推理任务
Qwen 3.7 Max57中国闭源旗舰
Claude Sonnet 4.680.8%(Verified)写作与指令遵循最佳

一位工程师在实测 20 个任务后的结论:Claude Opus 4.8 赢了 16 个,GPT-5.5 赢了 5 个,Gemini 3.1 Pro 赢了 4 个。特别是长上下文任务,Opus 几乎是碾压级别。

另一个需要特别说明的是 Claude Fable 5——它在所有榜单上拿下满分质量评级(100/100),SWE-bench Verified 约 95%,但因政府出口管制于 2026 年 6 月中旬全球下架,目前状态未定。它的存在说明:美国顶尖模型在纯能力层面仍然领先,只是可及性受政策约束。

用量冠军:中国模型靠性价比和速度统治日常任务

中国模型拿到这么高的用量份额,核心逻辑只有三条:

  1. 价格:MiniMax M3 的 API 定价仅 $0.60/M 输入 token,约为 Claude Opus 4.8($5.00/M)的 1/8
  2. 够用:对于日常编程辅助、代码补全、翻译、摘要等任务,中国模型能达到顶级模型 80–90% 的效果
  3. 开放权重:DeepSeek V4、MiniMax M3 等提供开放权重,企业可自部署,彻底消除数据隐私顾虑

各场景最优选择速查表(2026 年 6 月版)

场景推荐模型理由
复杂代码 / AgentClaude Opus 4.8综合能力第一,长上下文无敌
日常编程辅助DeepSeek V4 Flash / MiMo-V2.5性价比极高,速度快
超高性价比 APIMiniMax M3$0.60/M,开放权重,可自部署
长上下文处理Kimi K2.6(1M context)超长窗口,价格合理
Google 生态整合Gemini 3.5 FlashGoogle Workspace 原生支持
实时 Web 搜索Grok 4.3X/Twitter 实时内容获取
自建本地部署GLM 5.2 / Kimi K2.6顶级开放权重模型
图像生成ChatGPT Images 2.0文字渲染最强
最佳日常对话GPT-5.5较 GPT-5.3 幻觉减少 52.5%,生态完善

下半年预测:即将到来的「模型大爆发季」

Q3 2026 很可能是 AI 史上模型发布最密集的季度。以下是目前最高置信度的预测:

已确认或高概率发布(2026 年 Q3)

模型厂商预计时间核心看点
GPT-6OpenAI2026 年 8–9 月更长上下文(传闻 1.5M token),更强 Agent 能力
Claude Opus 5Anthropic2026 年 9 月前后接棒 Opus 4.8,长程 Agent 任务全面升级
Gemini 4Google2026 年 Q3多模态升级,视频理解、音频输入全面强化
DeepSeek V5DeepSeek2026 年 Q3开放权重,预计参数量破 1T,对标闭源前沿
GLM 5.2智谱 Z.ai已发布当前顶级开放权重之一,编程能力极强
Grok 4.3+xAI2026 年 Q31M context,增强实时 Web

其中 GPT-6、Claude Opus 5、Gemini 4 等三款很可能在 8 月中旬至 9 月下旬的六周窗口内集中落地——基准榜首换手速度将快过任何媒体周期。

五条宏观趋势预判

  1. 竞争轴从「谁最强」转向「谁最适合这个场景」:五大实验室将在同一个 90 天窗口内密集发布,届时不会再有单一的「最强模型」。理智策略:闭源前沿处理最难的 5% 任务,中国开放权重模型处理剩余 95% 的日常量。
  2. 中国模型份额将继续上升,但企业合规将成为上限:个人开发者层面还会增长,但 Fortune 500 采购受美国国会监管、数据驻留与供应链安全约束——中国模型或在 indie 开发者中达 70%+ OpenRouter 份额,企业采购仍可能低于 30%。
  3. Agent 才是真正的战场:2026 年已被定义为「Agent 从实验转向生产」的元年。Anthropic《2026 年 AI Agent 状态报告》显示,近 44% 的 Claude API 调用来自数学和计算机任务。下半年,谁的 Agent 能力更稳定,谁才是真正的赢家。
  4. OpenAI 和 Anthropic 双双 IPO 的影响:两家公司均于 2026 年 6 月传出 IPO 意向,将重新定价整个 AI 赛道估值;上市后的商业压力会让定价更透明,也可能加速与中国模型的价格战。
  5. 本地运行将在消费级硬件上突破 80% SWE-bench:预计在 2027 年内,消费级 GPU(32GB 内存)上运行的本地模型将突破 SWE-bench 80% 的编程能力门槛——商业 API 市场的日常编程助手将被根本颠覆。

六步落地:构建可随榜单切换的模型无关架构

  1. 按任务复杂度分桶:将流量分为 critical(5% 最难任务)/ standard / bulk 三档;critical 路由 Opus 4.8 / GPT-5.5,bulk 路由 DeepSeek V4 Flash / MiniMax M3。
  2. 在 Gateway 配置 fallback 队列:参考OpenClaw 多 provider 路由清单,主用 429 时自动降级,避免单点依赖 > 60% token。
  3. 埋点记录实际 provider 与成本:写入 x-provider-used 响应头,按日对账——「便宜模型 + 重试 3 次」可能比贵模型更贵。
  4. 为 Q3 发布预留 A/B 槽位:GPT-6、Opus 5、DeepSeek V5 落地后 48 小时内接入 experimental 路由,用 5% 流量灰度。
  5. 开放权重作合规备份:DeepSeek V4、Kimi K2.6、GLM 5.2 可在私有 Ollama/vLLM 上自托管,消除数据出境顾虑。
  6. 月度对照 OpenRouter 排行复盘:把公开榜单趋势与自家 30 天日志放在同一份评审里,决定是否调整主用模型——与5 月路由决策矩阵形成季度迭代闭环。

三条可写进 OKR 的硬核数据

  • 美国模型 OpenRouter 份额一年跌幅:70% → 30%(-40pp),Bloomberg / Exponential View 口径——这不是渐进调整,是结构性重排。
  • 价格剪刀差:MiniMax M3 输入 $0.60/M vs Claude Opus 4.8 $5.00/M,约 8 倍价差;圣地亚哥开发者实测 Claude 编程 $10/小时 vs DeepSeek <$0.50/小时
  • Agent 调用占比:Anthropic 2026 State of AI Agents 报告——44% Claude API 调用来自数学与计算机任务;SWE-bench Pro 榜首 Opus 4.8 为 69.2%,消费级本地模型预计 2027 年达 80% Verified 门槛。

结语:这不只是「中国模型赢了」的故事

这个故事的本质,是 AI 模型层的利润正在被快速压缩。DeepSeek 在 2025 年初的出现,证明了一件事:在足够高效的架构下,顶尖模型不需要顶尖算力。小米、腾讯、MiniMax、Moonshot 迅速复制这一结论,把模型的「基础定价」打到了地板价。

美国厂商的应对策略也因此分化:OpenAI 押注生态(插件、企业集成、DALL-E、Codex Mobile);Anthropic 死守质量高地(Claude Opus 的 Agent 能力确实鹤立鸡群);Google 选择速度和多模态(Gemini Flash 系列是目前性价比最高的闭源选项之一)。中间的「质量不差但价格贵」的位置,正在快速消失。

对于普通开发者和技术决策者来说,现在最值钱的能力,不是「选对最强模型」,而是构建一个能随时切换模型的架构——今天的第一名,三个月后可能就不是了。

若你把多模型路由 Gateway 跑在笔记本或合用机上,合盖睡眠、网络抖动与日志散落会让「按复杂度路由」的策略难以 7×24 落地。对需要稳定 Agent 调度的生产环境,把 Gateway 落在 MACCOME Mac mini(M4 / M4 Pro)独占节点上,通常比在本地与降级队列搏斗更省总成本;公开档位见租赁价格说明,拓扑可参考SSH 常驻 Gateway Runbook

常见问题

OpenRouter 2026 年 6 月最受欢迎的 AI 模型是哪个?

按日均 Token 量,DeepSeek V4 Flash(619B)位居第一;按公司周 Token 量,DeepSeek(5.13T,17.6%)领先 Anthropic(4.34T,14.8%)。完整榜单见 OpenRouter Rankings

DeepSeek 比 Claude 更好吗?

取决于任务。Claude Opus 4.8 在 Artificial Analysis Intelligence Index 以 61.4 分居综合能力第一,适合复杂代码与长上下文 Agent;DeepSeek V4 Flash 在用量与性价比上碾压,适合日常编程。圣地亚哥开发者实测:Claude 编程约 $10/小时,DeepSeek 不到 50 美分/小时。落地多模型路由可参考MACCOME 租赁方案部署 7×24 Gateway。

2026 年 Q3 将发布哪些前沿模型?

高置信度预测包括:GPT-6(8–9 月,传闻 1.5M 上下文)、Claude Opus 5(约 9 月)、Gemini 4(Q3 多模态升级)、DeepSeek V5(开放权重、~1T 参数)、Grok 4.3+(1M context)。三款美国旗舰很可能在六周内集中落地。

Claude Fable 5 为什么下架?还能用吗?

Fable 5 曾获 100/100 质量评级,但因美国政府出口管制于 2026 年 6 月中旬全球下架,目前状态未定。替代方案:复杂任务用 Claude Opus 4.8;若受合规限制,可参考本站Fable 5 封禁与多供应商架构一文。