openPangu 2.0 Flash と Pro の違いは何ですか？

Flash（92B 総パラメータ/6B アクティブ）は 2026-06-30 に公開済みで、低コスト高並列推論に適しています。Pro（505B/18B アクティブ）は 7 月公開予定で、超長文書と複雑タスク向けです。両バージョンとも 512K コンテキストに対応し、昇騰 910B で学習されています。

openPangu 2.0 と DeepSeek V4 Pro はどちらを選ぶべきですか？

コード生成と複雑推論では DeepSeek V4 Pro（約 200B アクティブ）が優位です。超長コンテキスト（512K vs 128K）、国産化コンプライアンス、昇騰ネイティブデプロイ、学習コードのフルスタック公開では openPangu 2.0 がほぼ代替不可能です。

ファーウェイ openPangu 2.0 オープンソース公開：505B MoE、512K コンテキストと昇騰フルスタック OSS

約 24 分で読めます · MACCOME

超長契約書・コードベース処理、国産化コンプライアンス、昇騰環境へのデプロイで大規模言語モデルを選定している場合——2026 年 6 月 30 日、ファーウェイは HDC 2026 の約束を果たし、openPangu-2.0-Flash の重み、推論コード、学習・推論オペレータを GitCode Ascend Tribe に公開しました。本記事は公式発表と調査資料に基づき、① タイムラインと Pro/Flash のコア仕様、② 7 大 OSS コンポーネントの価値、③ mHC/Muon/ModAttn/DSA+SWA のアーキテクチャ革新、④ NVIDIA 非依存の最先端学習の意義、⑤ DeepSeek/Qwen/Kimi との競合比較、⑥ ModelArts API と GitCode 自前デプロイ 6 段階、⑦ 戦略的意義・HarmonyOS Agent・ライセンスを解説します。独立第三者ベンチマークは評価中のため、能力評価はアーキテクチャに基づく推定と明記しています。

openPangu 2.0 選定の 6 つの誤解（デプロイ前に確認）

「総合能力最強の OSS モデル」と誤認する：コード生成と複雑推論では DeepSeek V4 Pro（約 200B アクティブ）が依然として優位です。openPangu 2.0 の代替不可能性は 512K コンテキスト、昇騰ネイティブ効率、フルスタック OSS にあります。
「NVIDIA 非依存学習」の地政学・技術的意義を軽視する：openPangu 2.0 は世界初の非 NVIDIA ハードウェアで最先端規模の学習を完了した OSS 大規模モデルで、昇騰 910B のみを使用し A100/H100 は使っていません。
重みだけ取得し、下半期の学習コードを無視する：業界の多くは重みと推論のみ公開します。openPangu は事前学習コード、事後学習コード（SFT/RLHF）、学習オペレータの公開を計画しており、超大規模 MoE では極めて稀です。
NVIDIA GPU で 2 倍スループットを期待する：単卡 2 倍の優位性は昇騰親和アーキテクチャ向けです。純 CUDA 環境ではコミュニティの大容量メモリテストを参照し、公式最適値をそのまま当てはめないでください。
Flash のスパース比データを混同する：Pro は約 28:1、Flash は約 15:1（DSA+SWA による極限推論効率）。両バージョンとも 512K コンテキストに統一されています。
エッジと HarmonyOS エコシステムを見落とす：ネイティブ 30B エッジモデルは推論 50% 高速化、メモリ 20% 削減。麒麟チップ搭載スマートフォンでオフライン実行可能。HarmonyOS 7 Agent のネイティブエンジンは openPangu 2.0 です。

イベントタイムラインとコアデータ一覧

日時	イベント
2026-06-12	HDC 2026 東莞松山湖、余承東の基調講演で openPangu 2.0 を正式発表
2026-06-30	openPangu-2.0-Flash 重み、基本推論コード、学習・推論オペレータを GitCode で OSS 公開
2026-07（予定）	openPangu-2.0-Pro モデル重みと推論コードを公開
2026 下半期（予定）	事前学習コード、事後学習コード、学習オペレータなど追加コンポーネントを順次公開

Pro vs Flash：2 バージョン、512K 統一

項目	openPangu 2.0 Pro	openPangu 2.0 Flash
総パラメータ数	505B	92B
アクティブパラメータ数	18B	6B
スパース比	約 28:1	約 15:1
コンテキストウィンドウ	512K	512K
利用可能状況	7 月公開予定	2026-06-30 公開済み
学習ハードウェア	ファーウェイ昇騰 910B NPU（NVIDIA 不使用）
ライセンス	openPangu License（商用可、ロイヤリティフリー、非独占）

info

512K コンテキストとは？約 『三体』第 1 部 8 冊分のテキスト量に相当します。完全な契約書、大規模コードベース、超長会話履歴を単一プロンプトで投入でき、現行 OSS モデルの中でも最長クラスのコンテキストです。

7 大 OSS コンポーネント：なぜ今回の公開価値が高いのか

多くの OSS 大規模モデルは重みと推論コードのみを公開します。openPangu 2.0 は 7 大コンポーネントの OSS を計画しており、後半 3 つは超大規模 MoE では極めて稀です：

コンポーネント	状況
1. モデル構造（アーキテクチャ定義）	公開済み
2. モデル重み（Flash 6/30 公開、Pro 7 月）	Flash 公開済み / Pro 予定
3. 技術レポート	重みと同時公開
4. 推論コード + 学習・推論オペレータ	公開済み
5. 事前学習コード	下半期予定
6. 事後学習コード（SFT/RLHF）	下半期予定
7. 学習オペレータ（昇騰高性能カスタムオペレータ）	下半期予定

研究者は学習フロー全体を再現でき、企業は独自データで垂直領域の二次事前学習が可能です——真の意味でのフルスタック OSSです。

技術アーキテクチャ詳解：MoE 革新の 4 キーワード

mHC（Multi-Head Combinatorial）ルーティング：エキスパートルーティング効率を改善し、MoE 特有の負荷不均衡を低減します。
Muon オプティマイザ：Microsoft 提案の二階モーメンタム最適化で、大規模学習の安定性を向上します。
ModAttn（Modular Attention）：モジュラーアテンションで 512K 超長コンテキストに適応しつつ効率を維持します。
DSA+SWA 超スパースアテンション（Flash 専用）：極限のスパース推論を実現。6B アクティブで 92B 知識プールを呼び出し、計算要件は密な 6B モデルに近い水準です。

昇騰ハードウェア適応と学習ブレークスルー

学習ハードウェア：昇騰 910B NPU で全工程学習。非 NVIDIA ハードウェアで全規模学習を完了した初の最先端大規模モデル
推論最適化：昇騰親和アーキテクチャで単卡スループットは主流 OSS の 2 倍。推論レイテンシは同クラス比 1.2 倍 優位
スーパーノード学習効率：+30%。512K 長系列学習スループット：+50%
学習・推論一貫性：分布一致率 >99%（MoE の難題であり、極めて価値が高い）
量子化：Flash-Int8 公開済み。W4A8 量子化でメモリ使用量 40% 削減、精度損失 <10%
エッジ：30B エッジモデルで推論 50% 高速化、メモリ 20% 削減。麒麟チップスマートフォンでオフライン実行可能

開発者エコシステム：CANN + torch_npu

ソフトウェアスタックは CANN（CUDA 相当）と torch_npu（PyTorch アダプター）に基づきます。標準 PyTorch コードは import torch_npu で昇騰バックエンドに切り替え可能です。デプロイ経路：ファーウェイクラウド ModelArts API、GitCode 自前デプロイ、HarmonyOS ネイティブ統合。

DeepSeek、Qwen、Kimi、Llama との競合比較

モデル	総パラメータ	アクティブ	コンテキスト	学習 HW	OSS 範囲
openPangu 2.0 Pro	505B	18B	512K	昇騰 NPU	フルスタック（7 コンポーネント）
openPangu 2.0 Flash	92B	6B	512K	昇騰 NPU	フルスタック（7 コンポーネント）
DeepSeek V4 Pro	1.6T	約 200B	128K	NVIDIA	重み+推論
Qwen 3.7 Max	約 400B+	varies	128K	NVIDIA	重み+推論+一部学習
Kimi K2.7	1T	32B	256K	NVIDIA	重み+推論
Llama 4 405B	405B	—	128K	NVIDIA	重み+推論

能力軸	openPangu 2.0 Pro	DeepSeek V4 Pro	Qwen 3.7 Max	Kimi K2.7
コード生成	★★★	★★★★★	★★★★	★★★★
複雑推論	★★★	★★★★★	★★★★★	★★★★
ツール呼び出し/Agent	★★★★	★★★★	★★★★	★★★★★
超長コンテキスト	★★★★★	★★★	★★★	★★★★
推論効率（昇騰）	★★★★★	★★	★★	★★★★
自主可控	★★★★★	★	★	★
フルスタック OSS	★★★★★	★★★	★★★	★★★

シナリオ別選定フロー

コード生成 / 複雑推論 → DeepSeek V4 Pro（200B アクティブ、性能優位）
Agent / マルチツール連携 → Kimi K2.7（MCP エコシステム充実）
超長文書（>256K トークン） → openPangu 2.0 Pro（512K 第一候補）
国産化 / コンプライアンス / NVIDIA 非依存 → openPangu 2.0（唯一の最先端選択肢）
昇騰 / ファーウェイクラウド環境 → openPangu 2.0（ネイティブ 2 倍スループット）
エッジ / スマートフォンデプロイ → openPangu Embedded（30B エッジ）
低コストローカル推論 → openPangu 2.0 Flash（6B アクティブ、約 96GB で実行可能）

6 月 OpenRouter ランキング分析と補完関係にあります。DeepSeek は利用量とコスパで優位、openPangu はコンテキスト長と昇騰スタックとの深い統合で優位です。

6 段階実装：ModelArts API から GitCode 自前デプロイまで

シナリオとバージョンを明確化：超長文書・国産化は Pro（7 月）。即時利用・高並列 API は Flash（公開済み）。
クラウド最短経路：ファーウェイクラウド ModelArts：アカウント登録 → ModelArts → AI Gallery → openPangu 2.0 を検索 → 購読して API エンドポイントを取得。
API 呼び出し検証：Chat Completions 形式でテストリクエストを送信（下記 curl 例）。
GitCode で重みとコードを取得：Ascend Tribe——openPangu-2.0-Flash、openPangu-2.0-Flash-Int8、openPangu-2.0-Infer、openPangu-2.0-Op。
昇騰単卡 / 複数卡推論：Flash は単卡 910B。Pro は複数卡分散（8 卡クラスター）。Int8 版は約 48GB VRAM。
ドメイン微調整（LoRA）：重み公開後 finetune.py --method lora --lora_rank 16 が利用可能。下半期の事前学習コード公開後は二次事前学習も可能です。

bash — ModelArts API

curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
  -H "Content-Type: application/json" \
  -H "X-Auth-Token: ${TOKEN}" \
  -d '{
    "model": "openpangu-2.0-flash",
    "messages": [{"role": "user", "content": "こんにちは、自己紹介をお願いします"}],
    "max_tokens": 1024,
    "temperature": 0.7
  }'

bash — Flash 単卡昇騰推論

python inference.py \
  --model_path ./openPangu-Flash \
  --device npu:0 \
  --context_length 512000 \
  --precision bf16

バージョン	推奨 HW	最小構成	備考
Flash（6B アクティブ）	単卡昇騰 910B	約 96GB 統一メモリ	大容量メモリシステムで試行可能
Flash-Int8	単卡 Atlas A2	約 48GB VRAM	W4A8、精度損失 <10%
Pro（18B アクティブ）	4+ 卡昇騰 910B	複数卡クラスター	7 月重み公開後に検証

戦略的意義：地政学背景、HarmonyOS Agent、ライセンス

地政学と歴史的意義

米国の A100/H100 対中輸出規制の下で、ファーウェイは昇騰 910B で 505B MoE を学習しフルスタック OSS 化しました——「NVIDIA なしでは大規模モデルは作れない」という主張への有力な反証です。余承東は HDC 2026 で「私の余生の辞書に第二はない、第一しかない」と述べました。

HarmonyOS Agent 時代の AI 基盤

HarmonyOS 7 は Agent インテリジェンス時代に全面移行。openPangu 2.0 は Agent タスクのネイティブ AI エンジンです
HarmonyOS エージェントフレームワーク 2.0 の複雑タスク実行成功率 >90%
エッジ 30B モデルでスマートフォン上のローカル大規模モデルを実現。ネットワーク不要

openPangu License の要点

商用利用可（Commercial Use Permitted）
ロイヤリティフリー、非独占
詳細条項は GitCode リポジトリを参照

OSS ロードマップと 3 つのハードデータ

2026-06-30 Flash 重み + 推論コード + 学習・推論オペレータ（公開済み）
2026-07 Pro 重み + 推論コード（予定）
2026 下半期 事前学習コード、事後学習コード、追加オペレータ、データ処理ツール（予定）

コンテキスト長差：openPangu 512K vs DeepSeek/Qwen 128K vs Kimi 256K——超長文書シナリオで 4 倍以上の優位。
昇騰スループット：単卡推論スループットは昇騰上の主流 OSS の 2 倍。学習・推論一致率 >99%。
Flash アクティブ効率：92B 総パラメータに 6B のみアクティブ（約 6.5%/トークン）。推論コストは密な 6B に近く、知識プールは 92B 規模。

まとめ：openPangu 2.0 は誰向けか

openPangu 2.0 は現時点で総合能力最強の OSS 大規模モデルではありませんが、以下の軸ではほぼ代替不可能です：

512K 超長コンテキスト——OSS モデル最高水準
国産化 / 自主可控——NVIDIA 学習に一切依存しない唯一の最先端モデル
昇騰ネイティブ最適化——ファーウェイクラウド/昇騰環境で 2 倍スループット
フルスタック OSS——学習コード公開計画を含み、業界でも極めて稀
エッジ + HarmonyOS——麒麟チップでのローカル実行と Agent ネイティブ統合

openPangu と DeepSeek/Qwen をマルチモデルルーティングする場合、ノート PC 上の Gateway は蓋を閉じると切断され、ログが散在して 512K 長コンテキスト Agent の 7×24 安定運用が困難になります。安定スケジューリング + 複数プロバイダー降格が必要な本番環境では、Gateway を MACCOME 独占 Mac mini ノードに置く方が、ローカル運用より総コストを抑えられます。プライベートモデルデプロイ Runbookと組み合わせ、公開料金はレンタル価格ページをご覧ください。

免責事項：本記事の一部ベンチマークと能力評価はアーキテクチャに基づく推定です。独立第三者のテスト結果公開後に更新します。公開日：2026 年 7 月 1 日。

参考リンク：GitCode Ascend Tribe · ファーウェイクラウド ModelArts · HDC 2026

よくある質問

openPangu 2.0 Flash と Pro はどう選びますか？

Flash（92B/6B アクティブ）は公開済みで、低コスト高並列 API と単卡推論に適しています。Pro（505B/18B）は 7 月公開予定で、超長契約書・大規模コードベース・二次事前学習向けです。両バージョンとも 512K コンテキストに対応します。

openPangu 2.0 と DeepSeek V4 Pro はどちらが優れていますか？

コードと複雑推論では DeepSeek V4 Pro が優位（約 200B アクティブ）。512K コンテキスト、国産化コンプライアンス、昇騰デプロイ、フルスタック学習コードでは openPangu を選びます。詳細は6 月 OpenRouter 選定分析を参照してください。

openPangu 2.0 の重みはどうダウンロードしますか？

gitcode.com/org/ascend-tribe にアクセスしてください。リポジトリには openPangu-2.0-Flash、Flash-Int8、Infer、Op が含まれます。ハードウェア不要のクラウド試用はファーウェイクラウド ModelArts API を利用できます。

国産化プロジェクトで openPangu 2.0 は使えますか？

はい。openPangu 2.0 は昇騰のみで学習した最先端 OSS 大規模モデルで、NVIDIA 非依存です。openPangu License の商用条項と合わせ、国産化コンプライアンスシナリオに適しています。Agent Gateway のデプロイはMACCOME レンタルプランを参照してください。