超長契約書・コードベース処理、国産化コンプライアンス、昇騰環境へのデプロイで大規模言語モデルを選定している場合——2026 年 6 月 30 日、ファーウェイは HDC 2026 の約束を果たし、openPangu-2.0-Flash の重み、推論コード、学習・推論オペレータを GitCode Ascend Tribe に公開しました。本記事は公式発表と調査資料に基づき、① タイムラインと Pro/Flash のコア仕様、② 7 大 OSS コンポーネントの価値、③ mHC/Muon/ModAttn/DSA+SWA のアーキテクチャ革新、④ NVIDIA 非依存の最先端学習の意義、⑤ DeepSeek/Qwen/Kimi との競合比較、⑥ ModelArts API と GitCode 自前デプロイ 6 段階、⑦ 戦略的意義・HarmonyOS Agent・ライセンスを解説します。独立第三者ベンチマークは評価中のため、能力評価はアーキテクチャに基づく推定と明記しています。
| 日時 | イベント |
|---|---|
| 2026-06-12 | HDC 2026 東莞松山湖、余承東の基調講演で openPangu 2.0 を正式発表 |
| 2026-06-30 | openPangu-2.0-Flash 重み、基本推論コード、学習・推論オペレータを GitCode で OSS 公開 |
| 2026-07(予定) | openPangu-2.0-Pro モデル重みと推論コードを公開 |
| 2026 下半期(予定) | 事前学習コード、事後学習コード、学習オペレータなど追加コンポーネントを順次公開 |
| 項目 | openPangu 2.0 Pro | openPangu 2.0 Flash |
|---|---|---|
| 総パラメータ数 | 505B | 92B |
| アクティブパラメータ数 | 18B | 6B |
| スパース比 | 約 28:1 | 約 15:1 |
| コンテキストウィンドウ | 512K | 512K |
| 利用可能状況 | 7 月公開予定 | 2026-06-30 公開済み |
| 学習ハードウェア | ファーウェイ昇騰 910B NPU(NVIDIA 不使用) | |
| ライセンス | openPangu License(商用可、ロイヤリティフリー、非独占) | |
512K コンテキストとは?約 『三体』第 1 部 8 冊分のテキスト量に相当します。完全な契約書、大規模コードベース、超長会話履歴を単一プロンプトで投入でき、現行 OSS モデルの中でも最長クラスのコンテキストです。
多くの OSS 大規模モデルは重みと推論コードのみを公開します。openPangu 2.0 は 7 大コンポーネントの OSS を計画しており、後半 3 つは超大規模 MoE では極めて稀です:
| コンポーネント | 状況 |
|---|---|
| 1. モデル構造(アーキテクチャ定義) | 公開済み |
| 2. モデル重み(Flash 6/30 公開、Pro 7 月) | Flash 公開済み / Pro 予定 |
| 3. 技術レポート | 重みと同時公開 |
| 4. 推論コード + 学習・推論オペレータ | 公開済み |
| 5. 事前学習コード | 下半期予定 |
| 6. 事後学習コード(SFT/RLHF) | 下半期予定 |
| 7. 学習オペレータ(昇騰高性能カスタムオペレータ) | 下半期予定 |
研究者は学習フロー全体を再現でき、企業は独自データで垂直領域の二次事前学習が可能です——真の意味でのフルスタック OSSです。
ソフトウェアスタックは CANN(CUDA 相当)と torch_npu(PyTorch アダプター)に基づきます。標準 PyTorch コードは import torch_npu で昇騰バックエンドに切り替え可能です。デプロイ経路:ファーウェイクラウド ModelArts API、GitCode 自前デプロイ、HarmonyOS ネイティブ統合。
| モデル | 総パラメータ | アクティブ | コンテキスト | 学習 HW | OSS 範囲 |
|---|---|---|---|---|---|
| openPangu 2.0 Pro | 505B | 18B | 512K | 昇騰 NPU | フルスタック(7 コンポーネント) |
| openPangu 2.0 Flash | 92B | 6B | 512K | 昇騰 NPU | フルスタック(7 コンポーネント) |
| DeepSeek V4 Pro | 1.6T | 約 200B | 128K | NVIDIA | 重み+推論 |
| Qwen 3.7 Max | 約 400B+ | varies | 128K | NVIDIA | 重み+推論+一部学習 |
| Kimi K2.7 | 1T | 32B | 256K | NVIDIA | 重み+推論 |
| Llama 4 405B | 405B | — | 128K | NVIDIA | 重み+推論 |
| 能力軸 | openPangu 2.0 Pro | DeepSeek V4 Pro | Qwen 3.7 Max | Kimi K2.7 |
|---|---|---|---|---|
| コード生成 | ★★★ | ★★★★★ | ★★★★ | ★★★★ |
| 複雑推論 | ★★★ | ★★★★★ | ★★★★★ | ★★★★ |
| ツール呼び出し/Agent | ★★★★ | ★★★★ | ★★★★ | ★★★★★ |
| 超長コンテキスト | ★★★★★ | ★★★ | ★★★ | ★★★★ |
| 推論効率(昇騰) | ★★★★★ | ★★ | ★★ | ★★★★ |
| 自主可控 | ★★★★★ | ★ | ★ | ★ |
| フルスタック OSS | ★★★★★ | ★★★ | ★★★ | ★★★ |
6 月 OpenRouter ランキング分析と補完関係にあります。DeepSeek は利用量とコスパで優位、openPangu はコンテキスト長と昇騰スタックとの深い統合で優位です。
openPangu-2.0-Flash、openPangu-2.0-Flash-Int8、openPangu-2.0-Infer、openPangu-2.0-Op。finetune.py --method lora --lora_rank 16 が利用可能。下半期の事前学習コード公開後は二次事前学習も可能です。curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
-H "Content-Type: application/json" \
-H "X-Auth-Token: ${TOKEN}" \
-d '{
"model": "openpangu-2.0-flash",
"messages": [{"role": "user", "content": "こんにちは、自己紹介をお願いします"}],
"max_tokens": 1024,
"temperature": 0.7
}'
python inference.py \ --model_path ./openPangu-Flash \ --device npu:0 \ --context_length 512000 \ --precision bf16
| バージョン | 推奨 HW | 最小構成 | 備考 |
|---|---|---|---|
| Flash(6B アクティブ) | 単卡昇騰 910B | 約 96GB 統一メモリ | 大容量メモリシステムで試行可能 |
| Flash-Int8 | 単卡 Atlas A2 | 約 48GB VRAM | W4A8、精度損失 <10% |
| Pro(18B アクティブ) | 4+ 卡昇騰 910B | 複数卡クラスター | 7 月重み公開後に検証 |
米国の A100/H100 対中輸出規制の下で、ファーウェイは昇騰 910B で 505B MoE を学習しフルスタック OSS 化しました——「NVIDIA なしでは大規模モデルは作れない」という主張への有力な反証です。余承東は HDC 2026 で「私の余生の辞書に第二はない、第一しかない」と述べました。
openPangu 2.0 は現時点で総合能力最強の OSS 大規模モデルではありませんが、以下の軸ではほぼ代替不可能です:
openPangu と DeepSeek/Qwen をマルチモデルルーティングする場合、ノート PC 上の Gateway は蓋を閉じると切断され、ログが散在して 512K 長コンテキスト Agent の 7×24 安定運用が困難になります。安定スケジューリング + 複数プロバイダー降格が必要な本番環境では、Gateway を MACCOME 独占 Mac mini ノードに置く方が、ローカル運用より総コストを抑えられます。プライベートモデルデプロイ Runbookと組み合わせ、公開料金はレンタル価格ページをご覧ください。
免責事項:本記事の一部ベンチマークと能力評価はアーキテクチャに基づく推定です。独立第三者のテスト結果公開後に更新します。公開日:2026 年 7 月 1 日。
参考リンク:GitCode Ascend Tribe · ファーウェイクラウド ModelArts · HDC 2026
よくある質問
openPangu 2.0 Flash と Pro はどう選びますか?
Flash(92B/6B アクティブ)は公開済みで、低コスト高並列 API と単卡推論に適しています。Pro(505B/18B)は 7 月公開予定で、超長契約書・大規模コードベース・二次事前学習向けです。両バージョンとも 512K コンテキストに対応します。
openPangu 2.0 と DeepSeek V4 Pro はどちらが優れていますか?
コードと複雑推論では DeepSeek V4 Pro が優位(約 200B アクティブ)。512K コンテキスト、国産化コンプライアンス、昇騰デプロイ、フルスタック学習コードでは openPangu を選びます。詳細は6 月 OpenRouter 選定分析を参照してください。
openPangu 2.0 の重みはどうダウンロードしますか?
gitcode.com/org/ascend-tribe にアクセスしてください。リポジトリには openPangu-2.0-Flash、Flash-Int8、Infer、Op が含まれます。ハードウェア不要のクラウド試用はファーウェイクラウド ModelArts API を利用できます。
国産化プロジェクトで openPangu 2.0 は使えますか?
はい。openPangu 2.0 は昇騰のみで学習した最先端 OSS 大規模モデルで、NVIDIA 非依存です。openPangu License の商用条項と合わせ、国産化コンプライアンスシナリオに適しています。Agent Gateway のデプロイはMACCOME レンタルプランを参照してください。