2026 OpenClaw マルチモデル/プロバイダのルーティングとフェイルオーバー
npm と Docker パス、枠と Gateway ログの切り分け

読了目安 約21分 · MACCOME

2026 年、OpenClaw をインストールまたは Docker/Compose から運用しているチームがつまずくのは、しばしば誤ったモデルルート、429 とタイムアウトの混線、フェイルオーバー順の不整合、npm グローバルとコンテナ間の環境変数の分断です。「インストールできない」ではありません。本稿は《クロスプラットフォーム導入》《Docker 本番》《アップグレードと移行》と役割を分け、実行時のマルチモデルルーティング、実行可能なフェイルオーバー、二経路の対照表、症状ベースの Gateway/CLI ログ切り分けに焦点を当てます。インストール後の症状は《doctor 切り分け》へ続けてください。

マルチモデル展開の痛み六分類(当番 Runbook に載せる)

デフォルトとフォールバックのモデル、異なるプロバイダのレート制限が Gateway の背後にあると、障害はランダムに見えます。HTTP ステータスだけでなく、次の六分類をアラート項目にマッピングしてください。

  1. モデル ID とルート表のズレ:表示名は変わったのにリクエストは古い ID のまま、CLI と Gateway のキャッシュが分岐する。
  2. 429 とタイムアウトの混同:スロットリングはバックオフとキー交代、タイムアウトは期限と egress の修正が必要で、混ぜるとリトライ嵐が増幅する。
  3. マルチキー交代に境界がない:プライマリと予備キーが同じ失敗予算を共有し、両方が焼ける。
  4. npm グローバルと Compose 環境の分岐:ホストの export だけでコンテナに注入されていない、または compose の上書きが意図と逆。
  5. ヘルスチェックがプロセス生存だけ:Gateway は起きているがモデル握手が失敗しても緑に見える。
  6. ログに次元がない:request id、セッション、プロバイダ、モデルが揃わないと、サービス横断で一連の呼び出しを再構成できない。

これらの痛みはアップグレードのバックアップやイメージタグとは直交します。実行時ルーティングと変更管理は別物です。リリースと当番を切り分けるために両方を読んでください。

マルチモデルは通常、複数の課金アカウントとコンプライアンス境界を意味します。セッションがモデルに明示的にスコープされていないと、過剰課金やポリシー違反のリスクがあります。ルート表を Secrets ガバナンスとあわせてレビューするコストと権限の契約として扱ってください。

「エンドポイントに届く」ことと「チェーンが健全」ことは別です。プロキシ、ファイアウォール、DNS がセッションごとに成功を分断することがあります。構造化ログとサンプリングの方が、単一のグローバルエラー率より有効です。

表1:npm グローバルと Docker/Compose(レビュー用)

設定の読み込み順、環境の優先順位、再起動の境界を両方の経路で文書化しないと、「ホストは変えたがコンテナは変わっていない」が起きます。

次元npm グローバル/ローカルプロセスDocker/Compose
設定とシークレットユーザ設定ファイルとシェル環境が優勢env_file、マウント、実行時 -e を明示する必要がある
アップグレードとロールバックグローバル CLI による npm パッケージの固定イメージタグ、ボリューム、アップグレードガイドに沿った docker compose pull の順序
ヘルスチェックsystemd/launchd のプローブに合わせるコンテナ内 curl/CLI;ネットワークスタックはホストと異なる(ループバック方針を含む)
よくあるミス複数の Node バージョンで誤ったグローバルが選ばれるホットリロード前提の読み取り専用マウント、再ビルド後に環境が消える

表2:症状→最初の手(フェイルオーバー順の例—ポリシーに合わせて調整)

組織全体でモデルを替えるか、キーを替えるか、egress を直すかのルールを決め、同じ SLO 文書に書きます。番号が小さいほど先に試します。

症状(ログ/メトリクス)想定原因例の順序
HTTP 429 または明示的なレート制限枠または同時実行バックオフ→予備キー→同時実行を下げる→一時的なフォールバックモデル
タイムアウト、リセット、遅い TLSネットワーク経路またはリージョン egressタイムアウト延長(上限付き)→プロキシ/DNS→近い egress
モデル欠如/権限なしID またはアカウント権限プロバイダコンソールを確認→ルート表を修正→無関係なフォールバックを黙って使わない
セッションの一部だけ成功キーの偏りまたはスティッキールーティングの誤りキー別カウンタとサーキットブレーカ→セッション固定→ Gateway シャーディング
text
# リクエストごとの最低限のログ項目(例):
# requestId / sessionId / provider / modelId / status / latencyMs
# いずれかが欠けているなら、ルートを盲信で変える前に可観測性を足す
warning

注意:より小さく安いモデルにダウングレードする場合、下流の自動化やレビュー手順での能力ギャップをラベル付けしてください。黙って「賢くない」出力が出ると業務インシデントになります。

六ステップ:ルート表を固定し、可観測性のループを閉じる

  1. ルート表バージョンの固定:デフォルト、シナリオ別フォールバック、禁止モデル;設定の Git SHA に紐付ける。
  2. チェーン別 SLO:P95 遅延、429 比率、連続失敗のサーキット閾値を当番と共有する。
  3. 二経路スモーク:npm と compose で最小チャットケース;ログのタプルを比較する。
  4. キー会計:プライマリ/予備で失敗回数とクールダウンを分離;ローテーションは《Secrets 上級編》に合わせる。
  5. アップグレード後のヘルス:プロセス生存からモデル握手または同等のプローブまで。
  6. インシデントテンプレート:すべてのインシデントにリクエストサンプルと設定バージョンを含め、アップグレード/移行記事と突き合わせる。

ダッシュボード向けの硬い指標が三つ

  1. 429/タイムアウト率をプロバイダとモデルで分割:ブレンドした成功率は悪いルートを隠します。
  2. キー別の失敗回数とクールダウン命中:マルチキー支出とローテーション周期に合わせる。
  3. ダウングレード発火と手動介入の回数:ダウングレードが頻発するなら、モデルを足す前に容量(例:専用リモート Mac)を見直す。

2026 年もプロバイダのカタログは変わり続けます。設定をドキュメントとして持つことが口伝より優れます。ルート表とアラート閾値を同じリポジトリに置き、引き継ぎの隙を減らしてください。

Gateway が APAC と北米にあるなら、リージョン×プロバイダのヒートマップを引いてください。地域劣化はしばしばグローバル赤の前兆で、バーストレンタルの判断材料になります。

ユーザージャーニーを分解します。認証→ルーティング→モデル呼び出し→ツール副作用→セッション書き戻し。各段でrequestIdを共有すべきです。無いならモデルをいじる前にトレースを足してください。

ハイブリッド(ノート、ベアサーバ、コンテナ)では週次の最小パリティテストを実行します。同じプロンプトとルート版を三経路で比較し、遅延/エラーのばらつきが閾値を超えたらリリースを止めます。

ノート PC とアドホックなプロキシがマルチモデル本番負荷に苦しい理由

個人端末はスリープ、不安定な WAN、監査されていない環境変数を足し、ルーティングの不具合を断続的な幽霊にします。CI、ページング、顧客 SLA が絡むなら専用計算、安定した egress、契約可能なレンタル条件が必要で、hosts の無限編集ではありません。

24/7 Gateway、バッチ自動化、ビルド/署名ホスト横の低遅延が必要なら、実行をプロ向けのマルチリージョン Mac クラウドに置く方が観測と監査がしやすいことが多いです。MACCOMEMac Mini M4/M4 Proのベアメタルを複数リージョンで柔軟な条件で提供しています。《マルチリージョンとレンタル期間のガイド》と料金をあわせてご検討ください。

パイロットでは一つのリージョンでルートとログ項目が安定するまで様子を見、その後 Gateway をワークロードと同居させてクロスリージョン推論とスロットリングを避けるか判断します。

上級チャネルを上級 Runbook から使う場合は、モデルルーティングの変更チャネル設定の変更を別リリースにし、爆発半径を抑えます。変更チケットにルート表バージョンを添付し、ログサンプリングと監査に使います。

よくある質問

アップグレード・移行ガイドとの違いは何ですか?

アップグレード編はバックアップとロールバックを扱います。本稿は実行時ルーティングと二経路のログです。切り分けは《doctor 切り分け》へ。商業条件は《レンタル料金》と《ヘルプセンター》をご確認ください。

Docker に新しいモデル名が出ているのにトラフィックが古い—最初は何ですか?

Compose のボリュームと環境の上書きを確認し、コンテナに読み込まれた設定と Gateway ログを見ます。《Docker 本番》のヘルスチェックとあわせてください。

専用リモート Mac で OpenClaw を計画するには?

SSH/VNC と配置をあわせて検討してください:《SSH と VNC》と《ヘルプセンター》。