ファーウェイ openPangu 2.0 オープンソース公開:505B MoE、512K コンテキストと昇騰フルスタック OSS

約 24 分で読めます · MACCOME

超長契約書・コードベース処理、国産化コンプライアンス、昇騰環境へのデプロイで大規模言語モデルを選定している場合——2026 年 6 月 30 日、ファーウェイは HDC 2026 の約束を果たし、openPangu-2.0-Flash の重み、推論コード、学習・推論オペレータを GitCode Ascend Tribe に公開しました。本記事は公式発表と調査資料に基づき、① タイムラインと Pro/Flash のコア仕様、② 7 大 OSS コンポーネントの価値、③ mHC/Muon/ModAttn/DSA+SWA のアーキテクチャ革新、④ NVIDIA 非依存の最先端学習の意義、⑤ DeepSeek/Qwen/Kimi との競合比較、⑥ ModelArts API と GitCode 自前デプロイ 6 段階、⑦ 戦略的意義・HarmonyOS Agent・ライセンスを解説します。独立第三者ベンチマークは評価中のため、能力評価はアーキテクチャに基づく推定と明記しています。

openPangu 2.0 選定の 6 つの誤解(デプロイ前に確認)

  1. 「総合能力最強の OSS モデル」と誤認する:コード生成と複雑推論では DeepSeek V4 Pro(約 200B アクティブ)が依然として優位です。openPangu 2.0 の代替不可能性は 512K コンテキスト、昇騰ネイティブ効率、フルスタック OSS にあります。
  2. 「NVIDIA 非依存学習」の地政学・技術的意義を軽視する:openPangu 2.0 は世界初の非 NVIDIA ハードウェアで最先端規模の学習を完了した OSS 大規模モデルで、昇騰 910B のみを使用し A100/H100 は使っていません。
  3. 重みだけ取得し、下半期の学習コードを無視する:業界の多くは重みと推論のみ公開します。openPangu は事前学習コード、事後学習コード(SFT/RLHF)、学習オペレータの公開を計画しており、超大規模 MoE では極めて稀です。
  4. NVIDIA GPU で 2 倍スループットを期待する:単卡 2 倍の優位性は昇騰親和アーキテクチャ向けです。純 CUDA 環境ではコミュニティの大容量メモリテストを参照し、公式最適値をそのまま当てはめないでください。
  5. Flash のスパース比データを混同する:Pro は約 28:1、Flash は約 15:1(DSA+SWA による極限推論効率)。両バージョンとも 512K コンテキストに統一されています。
  6. エッジと HarmonyOS エコシステムを見落とす:ネイティブ 30B エッジモデルは推論 50% 高速化、メモリ 20% 削減。麒麟チップ搭載スマートフォンでオフライン実行可能。HarmonyOS 7 Agent のネイティブエンジンは openPangu 2.0 です。

イベントタイムラインとコアデータ一覧

日時イベント
2026-06-12HDC 2026 東莞松山湖、余承東の基調講演で openPangu 2.0 を正式発表
2026-06-30openPangu-2.0-Flash 重み、基本推論コード、学習・推論オペレータを GitCode で OSS 公開
2026-07(予定)openPangu-2.0-Pro モデル重みと推論コードを公開
2026 下半期(予定)事前学習コード、事後学習コード、学習オペレータなど追加コンポーネントを順次公開

Pro vs Flash:2 バージョン、512K 統一

項目openPangu 2.0 ProopenPangu 2.0 Flash
総パラメータ数505B92B
アクティブパラメータ数18B6B
スパース比約 28:1約 15:1
コンテキストウィンドウ512K512K
利用可能状況7 月公開予定2026-06-30 公開済み
学習ハードウェアファーウェイ昇騰 910B NPU(NVIDIA 不使用)
ライセンスopenPangu License(商用可、ロイヤリティフリー、非独占)
info

512K コンテキストとは?『三体』第 1 部 8 冊分のテキスト量に相当します。完全な契約書、大規模コードベース、超長会話履歴を単一プロンプトで投入でき、現行 OSS モデルの中でも最長クラスのコンテキストです。

7 大 OSS コンポーネント:なぜ今回の公開価値が高いのか

多くの OSS 大規模モデルは重みと推論コードのみを公開します。openPangu 2.0 は 7 大コンポーネントの OSS を計画しており、後半 3 つは超大規模 MoE では極めて稀です:

コンポーネント状況
1. モデル構造(アーキテクチャ定義)公開済み
2. モデル重み(Flash 6/30 公開、Pro 7 月)Flash 公開済み / Pro 予定
3. 技術レポート重みと同時公開
4. 推論コード + 学習・推論オペレータ公開済み
5. 事前学習コード下半期予定
6. 事後学習コード(SFT/RLHF)下半期予定
7. 学習オペレータ(昇騰高性能カスタムオペレータ)下半期予定

研究者は学習フロー全体を再現でき、企業は独自データで垂直領域の二次事前学習が可能です——真の意味でのフルスタック OSSです。

技術アーキテクチャ詳解:MoE 革新の 4 キーワード

  • mHC(Multi-Head Combinatorial)ルーティング:エキスパートルーティング効率を改善し、MoE 特有の負荷不均衡を低減します。
  • Muon オプティマイザ:Microsoft 提案の二階モーメンタム最適化で、大規模学習の安定性を向上します。
  • ModAttn(Modular Attention):モジュラーアテンションで 512K 超長コンテキストに適応しつつ効率を維持します。
  • DSA+SWA 超スパースアテンション(Flash 専用):極限のスパース推論を実現。6B アクティブで 92B 知識プールを呼び出し、計算要件は密な 6B モデルに近い水準です。

昇騰ハードウェア適応と学習ブレークスルー

  • 学習ハードウェア:昇騰 910B NPU で全工程学習。非 NVIDIA ハードウェアで全規模学習を完了した初の最先端大規模モデル
  • 推論最適化:昇騰親和アーキテクチャで単卡スループットは主流 OSS の 2 倍。推論レイテンシは同クラス比 1.2 倍 優位
  • スーパーノード学習効率:+30%。512K 長系列学習スループット:+50%
  • 学習・推論一貫性:分布一致率 >99%(MoE の難題であり、極めて価値が高い)
  • 量子化:Flash-Int8 公開済み。W4A8 量子化でメモリ使用量 40% 削減、精度損失 <10%
  • エッジ:30B エッジモデルで推論 50% 高速化、メモリ 20% 削減。麒麟チップスマートフォンでオフライン実行可能

開発者エコシステム:CANN + torch_npu

ソフトウェアスタックは CANN(CUDA 相当)と torch_npu(PyTorch アダプター)に基づきます。標準 PyTorch コードは import torch_npu で昇騰バックエンドに切り替え可能です。デプロイ経路:ファーウェイクラウド ModelArts APIGitCode 自前デプロイHarmonyOS ネイティブ統合

DeepSeek、Qwen、Kimi、Llama との競合比較

モデル総パラメータアクティブコンテキスト学習 HWOSS 範囲
openPangu 2.0 Pro505B18B512K昇騰 NPUフルスタック(7 コンポーネント)
openPangu 2.0 Flash92B6B512K昇騰 NPUフルスタック(7 コンポーネント)
DeepSeek V4 Pro1.6T約 200B128KNVIDIA重み+推論
Qwen 3.7 Max約 400B+varies128KNVIDIA重み+推論+一部学習
Kimi K2.71T32B256KNVIDIA重み+推論
Llama 4 405B405B128KNVIDIA重み+推論
能力軸openPangu 2.0 ProDeepSeek V4 ProQwen 3.7 MaxKimi K2.7
コード生成★★★★★★★★★★★★★★★★
複雑推論★★★★★★★★★★★★★★★★★
ツール呼び出し/Agent★★★★★★★★★★★★★★★★★
超長コンテキスト★★★★★★★★★★★★★★★
推論効率(昇騰)★★★★★★★★★★★★★
自主可控★★★★★
フルスタック OSS★★★★★★★★★★★★★★

シナリオ別選定フロー

  • コード生成 / 複雑推論 → DeepSeek V4 Pro(200B アクティブ、性能優位)
  • Agent / マルチツール連携 → Kimi K2.7(MCP エコシステム充実)
  • 超長文書(>256K トークン) → openPangu 2.0 Pro(512K 第一候補)
  • 国産化 / コンプライアンス / NVIDIA 非依存 → openPangu 2.0(唯一の最先端選択肢)
  • 昇騰 / ファーウェイクラウド環境 → openPangu 2.0(ネイティブ 2 倍スループット)
  • エッジ / スマートフォンデプロイ → openPangu Embedded(30B エッジ)
  • 低コストローカル推論 → openPangu 2.0 Flash(6B アクティブ、約 96GB で実行可能)

6 月 OpenRouter ランキング分析と補完関係にあります。DeepSeek は利用量とコスパで優位、openPangu はコンテキスト長と昇騰スタックとの深い統合で優位です。

6 段階実装:ModelArts API から GitCode 自前デプロイまで

  1. シナリオとバージョンを明確化:超長文書・国産化は Pro(7 月)。即時利用・高並列 API は Flash(公開済み)。
  2. クラウド最短経路:ファーウェイクラウド ModelArts:アカウント登録 → ModelArts → AI Gallery → openPangu 2.0 を検索 → 購読して API エンドポイントを取得。
  3. API 呼び出し検証:Chat Completions 形式でテストリクエストを送信(下記 curl 例)。
  4. GitCode で重みとコードを取得Ascend Tribe——openPangu-2.0-FlashopenPangu-2.0-Flash-Int8openPangu-2.0-InferopenPangu-2.0-Op
  5. 昇騰単卡 / 複数卡推論:Flash は単卡 910B。Pro は複数卡分散(8 卡クラスター)。Int8 版は約 48GB VRAM。
  6. ドメイン微調整(LoRA):重み公開後 finetune.py --method lora --lora_rank 16 が利用可能。下半期の事前学習コード公開後は二次事前学習も可能です。
bash — ModelArts API
curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
  -H "Content-Type: application/json" \
  -H "X-Auth-Token: ${TOKEN}" \
  -d '{
    "model": "openpangu-2.0-flash",
    "messages": [{"role": "user", "content": "こんにちは、自己紹介をお願いします"}],
    "max_tokens": 1024,
    "temperature": 0.7
  }'
bash — Flash 単卡昇騰推論
python inference.py \
  --model_path ./openPangu-Flash \
  --device npu:0 \
  --context_length 512000 \
  --precision bf16
バージョン推奨 HW最小構成備考
Flash(6B アクティブ)単卡昇騰 910B約 96GB 統一メモリ大容量メモリシステムで試行可能
Flash-Int8単卡 Atlas A2約 48GB VRAMW4A8、精度損失 <10%
Pro(18B アクティブ)4+ 卡昇騰 910B複数卡クラスター7 月重み公開後に検証

戦略的意義:地政学背景、HarmonyOS Agent、ライセンス

地政学と歴史的意義

米国の A100/H100 対中輸出規制の下で、ファーウェイは昇騰 910B で 505B MoE を学習しフルスタック OSS 化しました——「NVIDIA なしでは大規模モデルは作れない」という主張への有力な反証です。余承東は HDC 2026 で「私の余生の辞書に第二はない、第一しかない」と述べました。

HarmonyOS Agent 時代の AI 基盤

  • HarmonyOS 7 は Agent インテリジェンス時代に全面移行。openPangu 2.0 は Agent タスクのネイティブ AI エンジンです
  • HarmonyOS エージェントフレームワーク 2.0 の複雑タスク実行成功率 >90%
  • エッジ 30B モデルでスマートフォン上のローカル大規模モデルを実現。ネットワーク不要

openPangu License の要点

  • 商用利用可(Commercial Use Permitted)
  • ロイヤリティフリー、非独占
  • 詳細条項は GitCode リポジトリを参照

OSS ロードマップと 3 つのハードデータ

  • 2026-06-30 Flash 重み + 推論コード + 学習・推論オペレータ(公開済み)
  • 2026-07 Pro 重み + 推論コード(予定)
  • 2026 下半期 事前学習コード、事後学習コード、追加オペレータ、データ処理ツール(予定)
  • コンテキスト長差:openPangu 512K vs DeepSeek/Qwen 128K vs Kimi 256K——超長文書シナリオで 4 倍以上の優位。
  • 昇騰スループット:単卡推論スループットは昇騰上の主流 OSS の 2 倍。学習・推論一致率 >99%
  • Flash アクティブ効率:92B 総パラメータに 6B のみアクティブ(約 6.5%/トークン)。推論コストは密な 6B に近く、知識プールは 92B 規模。

まとめ:openPangu 2.0 は誰向けか

openPangu 2.0 は現時点で総合能力最強の OSS 大規模モデルではありませんが、以下の軸ではほぼ代替不可能です:

  1. 512K 超長コンテキスト——OSS モデル最高水準
  2. 国産化 / 自主可控——NVIDIA 学習に一切依存しない唯一の最先端モデル
  3. 昇騰ネイティブ最適化——ファーウェイクラウド/昇騰環境で 2 倍スループット
  4. フルスタック OSS——学習コード公開計画を含み、業界でも極めて稀
  5. エッジ + HarmonyOS——麒麟チップでのローカル実行と Agent ネイティブ統合

openPangu と DeepSeek/Qwen をマルチモデルルーティングする場合、ノート PC 上の Gateway は蓋を閉じると切断され、ログが散在して 512K 長コンテキスト Agent の 7×24 安定運用が困難になります。安定スケジューリング + 複数プロバイダー降格が必要な本番環境では、Gateway を MACCOME 独占 Mac mini ノードに置く方が、ローカル運用より総コストを抑えられます。プライベートモデルデプロイ Runbookと組み合わせ、公開料金はレンタル価格ページをご覧ください。

免責事項:本記事の一部ベンチマークと能力評価はアーキテクチャに基づく推定です。独立第三者のテスト結果公開後に更新します。公開日:2026 年 7 月 1 日。

参考リンクGitCode Ascend Tribe · ファーウェイクラウド ModelArts · HDC 2026

よくある質問

openPangu 2.0 Flash と Pro はどう選びますか?

Flash(92B/6B アクティブ)は公開済みで、低コスト高並列 API と単卡推論に適しています。Pro(505B/18B)は 7 月公開予定で、超長契約書・大規模コードベース・二次事前学習向けです。両バージョンとも 512K コンテキストに対応します。

openPangu 2.0 と DeepSeek V4 Pro はどちらが優れていますか?

コードと複雑推論では DeepSeek V4 Pro が優位(約 200B アクティブ)。512K コンテキスト、国産化コンプライアンス、昇騰デプロイ、フルスタック学習コードでは openPangu を選びます。詳細は6 月 OpenRouter 選定分析を参照してください。

openPangu 2.0 の重みはどうダウンロードしますか?

gitcode.com/org/ascend-tribe にアクセスしてください。リポジトリには openPangu-2.0-FlashFlash-Int8InferOp が含まれます。ハードウェア不要のクラウド試用はファーウェイクラウド ModelArts API を利用できます。

国産化プロジェクトで openPangu 2.0 は使えますか?

はい。openPangu 2.0 は昇騰のみで学習した最先端 OSS 大規模モデルで、NVIDIA 非依存です。openPangu License の商用条項と合わせ、国産化コンプライアンスシナリオに適しています。Agent Gateway のデプロイはMACCOME レンタルプランを参照してください。