若你正為超長合約/程式碼庫處理、信創合規或昇騰環境部署選型大模型——2026 年 6 月 30 日華為兌現 HDC 2026 承諾:openPangu-2.0-Flash 權重、推理程式碼與訓推算子上線 GitCode Ascend Tribe。本文基於官方發布與調研材料,回答:① 時間線與 Pro/Flash 核心參數;② 7 大開源元件為何「含金量」極高;③ mHC/Muon/ModAttn/DSA+SWA 架構創新;④ 全球首個無 NVIDIA 前沿訓練的意義;⑤ 與 DeepSeek/Qwen/Kimi 競品矩陣;⑥ ModelArts API 與 GitCode 自部署六步指南;⑦ 戰略意義、HarmonyOS Agent 與開源協議。獨立第三方 benchmark 尚在評測中,文中能力評估均標註為架構推斷。
| 時間 | 事件 |
|---|---|
| 2026-06-12 | HDC 2026 東莞松山湖,余承東主題演講正式發布 openPangu 2.0 |
| 2026-06-30 | openPangu-2.0-Flash 權重、基礎推理程式碼、訓推算子開源上線 GitCode |
| 2026-07(規劃) | openPangu-2.0-Pro 模型權重與推理程式碼上線 |
| 2026 下半年(規劃) | 預訓練程式碼、後訓練程式碼、訓練算子等更多元件陸續上線 |
| 維度 | openPangu 2.0 Pro | openPangu 2.0 Flash |
|---|---|---|
| 總參數量 | 505B | 92B |
| 啟用參數量 | 18B | 6B |
| 稀疏比 | 約 28:1 | 約 15:1 |
| 上下文視窗 | 512K | 512K |
| 可用狀態 | 7 月規劃上線 | 2026-06-30 已上線 |
| 訓練硬體 | 華為昇騰 910B NPU(全程無 NVIDIA) | |
| 開源協議 | openPangu License(寬鬆商用、免版權費、非排他) | |
512K 上下文意味著什麼?約等於一次處理 8 本《三體》(第一部)的文字量——完整合約、大型程式碼庫、超長對話歷史可單 prompt 送入,是目前開源模型中最長上下文件位之一。
大多數開源大模型只放出權重與推理程式碼。openPangu 2.0 計劃開源 7 大元件,後三項在超大規模 MoE 中極為罕見:
| 元件 | 狀態 |
|---|---|
| 1. 模型結構(架構定義) | 已發布 |
| 2. 模型權重(Flash 6/30 已上線,Pro 7 月) | Flash 已上線 / Pro 規劃中 |
| 3. 技術報告 | 隨權重同步 |
| 4. 推理程式碼與訓推算子 | 已發布 |
| 5. 預訓練程式碼 | 下半年規劃 |
| 6. 後訓練程式碼(SFT/RLHF) | 下半年規劃 |
| 7. 訓練算子(昇騰高效能自訂算子) | 下半年規劃 |
這意味著研究者可以完整複現訓練流程,企業可基於專有資料做垂直域二次預訓練——真正意義上的全鏈路開源。
軟體棧基於 CANN(類 CUDA)與 torch_npu(PyTorch 適配層)。標準 PyTorch 程式碼透過 import torch_npu 即可切換昇騰後端。部署路徑:華為雲 ModelArts API、GitCode 自部署、鴻蒙原生整合。
| 模型 | 總參數 | 啟用參數 | 上下文 | 訓練硬體 | 開源程度 |
|---|---|---|---|---|---|
| openPangu 2.0 Pro | 505B | 18B | 512K | 昇騰 NPU | 全鏈路(7 元件) |
| openPangu 2.0 Flash | 92B | 6B | 512K | 昇騰 NPU | 全鏈路(7 元件) |
| DeepSeek V4 Pro | 1.6T | 約 200B | 128K | NVIDIA | 權重+推理 |
| Qwen 3.7 Max | 約 400B+ | varies | 128K | NVIDIA | 權重+推理+部分訓練 |
| Kimi K2.7 | 1T | 32B | 256K | NVIDIA | 權重+推理 |
| Llama 4 405B | 405B | — | 128K | NVIDIA | 權重+推理 |
| 能力維度 | openPangu 2.0 Pro | DeepSeek V4 Pro | Qwen 3.7 Max | Kimi K2.7 |
|---|---|---|---|---|
| 程式碼生成 | ★★★ | ★★★★★ | ★★★★ | ★★★★ |
| 複雜推理 | ★★★ | ★★★★★ | ★★★★★ | ★★★★ |
| 工具呼叫/Agent | ★★★★ | ★★★★ | ★★★★ | ★★★★★ |
| 超長上下文 | ★★★★★ | ★★★ | ★★★ | ★★★★ |
| 推理效率(昇騰) | ★★★★★ | ★★ | ★★ | ★★★★ |
| 自主可控 | ★★★★★ | ★ | ★ | ★ |
| 全鏈路開源 | ★★★★★ | ★★★ | ★★★ | ★★★ |
與6 月 OpenRouter 排行分析互補:DeepSeek 贏在用量與性價比,openPangu 贏在上下文長度與昇騰棧深度綁定。
openPangu-2.0-Flash、openPangu-2.0-Flash-Int8、openPangu-2.0-Infer、openPangu-2.0-Op。finetune.py --method lora --lora_rank 16;下半年預訓練程式碼開放後可做二次預訓練。curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
-H "Content-Type: application/json" \
-H "X-Auth-Token: ${TOKEN}" \
-d '{
"model": "openpangu-2.0-flash",
"messages": [{"role": "user", "content": "你好,請介紹一下你自己"}],
"max_tokens": 1024,
"temperature": 0.7
}'
python inference.py \ --model_path ./openPangu-Flash \ --device npu:0 \ --context_length 512000 \ --precision bf16
| 版本 | 推薦硬體 | 最低配置 | 備註 |
|---|---|---|---|
| Flash(6B 啟用) | 單卡昇騰 910B | 約 96GB 統一記憶體 | 社群大記憶體系統可嘗試 |
| Flash-Int8 | 單卡 Atlas A2 | 約 48GB 顯存 | W4A8,精度損失 <10% |
| Pro(18B 啟用) | 4+ 卡昇騰 910B | 多卡叢集 | 7 月權重上線後驗證 |
在美國對華限制 A100/H100 出口管制的背景下,華為用昇騰 910B 訓練出 505B MoE 並全鏈路開源——是對「沒有 NVIDIA 就無法做大模型」論述的有力回擊。余承東在 HDC 2026 表示:「在我余生的字典裡,沒有第二,只有第一。」
openPangu 2.0 不是現階段綜合能力最強的開源大模型,但在以下維度幾乎無可替代:
若你把 openPangu 與 DeepSeek/Qwen 做多模型路由,Gateway 跑在筆電上合蓋即斷、日誌散落會讓長上下文 Agent 難以 7×24 穩定。對需要穩定調度 + 多 provider 降級的生產環境,把 Gateway 落在 MACCOME 獨占 Mac mini 節點上,比在本機搏鬥更省總成本;可與私有模型部署 Runbook組合,公開檔位見租用價格說明。
免責聲明:本文部分 benchmark 與能力評估為基於架構的推斷,獨立第三方測試結果公布後將持續更新。發布日期:2026 年 7 月 1 日。
參考連結:GitCode Ascend Tribe · 華為雲 ModelArts · HDC 2026
常見問題
openPangu 2.0 Flash 和 Pro 怎麼選?
Flash(92B/6B 啟用)已上線,適合低成本高併發 API 與單卡推理;Pro(505B/18B)7 月上線,適合超長合約、大型程式碼庫與二次預訓練。兩版本均支援 512K 上下文。
openPangu 2.0 和 DeepSeek V4 Pro 哪個更好?
程式碼與複雜推理 DeepSeek V4 Pro 更強(約 200B 啟用);512K 上下文、信創合規、昇騰部署、全鏈路訓練程式碼選 openPangu。詳見6 月 OpenRouter 選型分析。
如何下載 openPangu 2.0 權重?
造訪 gitcode.com/org/ascend-tribe,儲存庫含 openPangu-2.0-Flash、Flash-Int8、Infer、Op。雲端免硬體試用可走華為雲 ModelArts API。
信創專案能用 openPangu 2.0 嗎?
可以。openPangu 2.0 是全球首個純昇騰訓練的前沿開源大模型,無 NVIDIA 依賴,配合 openPangu License 商用條款,適合信創合規場景。部署 Agent Gateway 可參考MACCOME 租用方案。