若你正准备或刚完成 OpenClaw 的 openclaw update / 镜像升级,却遇到 Control UI 能开、但 gateway probe 超时,或 ACP / CLI device 流在 2026.3.13+ 回归,本文回答:①升级前如何用 openclaw backup create 留下可恢复快照;②升级后 status → gateway status → gateway probe → doctor 验收阶梯怎么判「可上线 / 必须回退」;③probe / WebSocket 1006 / ACP「queue owner unavailable」分症状 Runbook。与版本迁移总清单、坏版本 digest 回滚互补——本篇只啃备份 + probe/ACP 验收。
backup create:回滚时只能凭记忆改配置,无法证明「上一良好态」的配对与通道状态。acpx 可能仍正常——应走本篇 ACP 分诊,而非先换模型。2026 上游与社区文档已日益把「升级」定义为可逆状态迁移,而不是单次 `npm install -g`。openclaw backup create 会把当前 ~/.openclaw(或 Docker 卷映射的等价目录)打成可命名归档,让你在 probe 连续失败、ACP 注册丢失时,有分钟级恢复到升级前组合的选项——这与发行通道钉版矩阵里的「已知良好 tag/digest」是同一套 FinOps 思维的两面:一个锁二进制,一个锁运行态配置与配对。
| 站内已有长文 | 本篇覆盖 | 本篇不重复 |
|---|---|---|
| 版本迁移总清单 | 升级前 backup create + 升级后 probe 阶梯 |
全量目录搬迁、多机 Gateway 切换细节 |
| 坏版本 digest 回滚 | 何时在 probe 失败后触发回退决策 | Compose pull / digest 锁死的逐步命令 |
| tools.profile 分诊 | 验收阶梯里「最小工具探针」一步 | allowlist 三层叠加专文 |
| Gateway 无回复 | probe 前先排除「完全无回复」 | 通道 OAuth、模型路由专文 |
在变更窗口开始前,固定执行备份 → 记录版本指纹 → 确认只有一个权威 Gateway。备份命令以你安装的 CLI 为准(2026 文档常见写法如下);若子命令名在不同频道略有差异,以 openclaw backup --help 输出为准,但原则不变:升级前必须有一份可恢复的本地归档。
openclaw --version
node -v # 目标:v24.x;不符先对齐 Node 基线再升 OpenClaw
openclaw backup create
# 可选:列出现有备份
ls -la ~/.openclaw/backup 2>/dev/null || ls -la "${OPENCLAW_STATE_DIR:-$HOME/.openclaw}/backup"
# 冻结「已知良好」组合(写入变更单)
openclaw gateway status
openclaw config get gateway.auth.token 2>/dev/null | head -c 8; echo "…(redacted)"
| 检查项 | 本机 npm | Docker Compose | 远程 Mac 常驻 |
|---|---|---|---|
| 状态目录 | ~/.openclaw 未进 iCloud/网盘同步 |
bind mount 指向宿主机固定路径 | OPENCLAW_STATE_DIR 在独占盘,工单可查 |
| 备份是否含敏感材料 | 通常含 Token/配对;归档按机密存储,恢复前评估是否轮换 | ||
| 双 Gateway | launchd + 手动各起一份 | compose 与宿主机各起 18789 | 笔记本转发 + 远端各起一份 |
| 磁盘水位 | 备份前 df -h 可用空间 ≥ 状态目录 2×(避免备份半截失败) |
||
注意:仅手工 tar ~/.openclaw 而不走官方备份命令时,可能漏掉版本化元数据或增量索引;生产变更窗口优先 backup create,手工 tar 仅作第二份冷备。
升级完成后,禁止只看 Control UI 或聊天窗口一句「你好」就关变更单。推荐固定阶梯(每步失败即停,记录 stderr 与版本号):
openclaw status — CLI 与配置可读openclaw gateway status — 进程/端口/绑定摘要openclaw gateway probe(或 --json)— loopback 握手与延迟openclaw doctor — 配置与依赖告警channels status --probe「可上线」建议定义为:阶梯 1–4 连续通过,且第 5 步在你实际使用的通道/工具面上通过。「必须回退」建议定义为:同一阶梯在 reload/重启后连续两轮仍失败,且影响生产 Agent;此时先恢复备份或按digest 回滚回到变更单记录的 tag/digest,而不是在坏版本上叠加更多配置补丁。
openclaw status openclaw gateway status openclaw gateway probe openclaw doctor # Docker 路径:升级后务必 reload 同一 compose 项目 # docker compose pull && docker compose up -d # docker compose restart <gateway-service> openclaw channels status --probe
| 症状 | 优先怀疑 | 第一动作 |
|---|---|---|
| probe 超时,gateway status 仍 healthy | 启动被 provider 插件拖慢;loopback 竞态 | 临时禁用故障 provider 扩展;延长 probe 前等待;Windows 对照社区回退到上一 patch |
| WebSocket 1006 closed before connect | Token/绑定/反代 Upgrade 头 | 对照配对与 1006 Runbook;本机先排除反代 |
| ACP「queue owner unavailable」 | ACP bridge 注册回归(2026.3.x) | 确认 host acpx 可用;对照版本 issue 钉版或回退;非首选换模型 |
openclaw devices list 超时 |
CLI device 流与 Gateway 版本不匹配 | 对齐 CLI/Gateway 同版本;必要时恢复 backup 再单步升级 |
| 通道完全无回复 | 通道/模型层 | 跳转无回复专文,暂停本篇 |
on-call 最容易在「再试一次 config」与「立刻回滚」之间摇摆。可用下表快速定夺(行=影响面,列=建议动作):
| 影响面 | 继续修(配置/插件) | 钉版/回退 | 临时禁用 ACP 或故障 provider |
|---|---|---|---|
| 仅 probe 红,业务通道正常 | 记录为监控噪声;修启动耗时 | 若监控 SLA 强制 probe 绿,则回退 patch | 禁用拖慢启动的 provider 扩展 |
| ACP 全断,聊天仍正常 | 查 bridge 注册与插件发现 | 已知 regression 窗口内回退 minor | 临时关 ACP,保通道 SLA |
| probe + 通道 + 工具全断 | 仅在做 backup 恢复后单步试 | 优先 backup restore 或 digest 回滚 | 不作为首选 |
compose pull/up;同一工单只升一档(例如 beta→stable 不要跳两频道)。在六国远程 Mac 上,建议把升级窗口与稳定性验收、磁盘水位检查并列:晚高峰同时做镜像 pull + 全量 probe,容易把「网络抖动」误判为「ACP 坏了」。更稳妥的是:在常电、独占、可写工单的节点上完成升级与验收,笔记本仅通过 SSH 转发访问 Control UI。
只在聊天里试一句「升级成功了吗」、或只靠手工改两三个 YAML 字段,无法通过审计,也无法在第二台机器复现同一护航路径。相对地,把 backup create、验收阶梯与 ACP/probe 分诊写进 runbook,能把「升级踩雷」从一晚上盲试,压到有备份、有回退点、有指标的十分钟级事件。
若你仍坚持在个人笔记本上追新频道,要接受三项隐性成本:睡眠导致 Gateway 假死、probe 与业务路径不一致、以及升级窗口与本地电源策略冲突。对需要 7×24、Node 24 基线稳定、变更可工单化 的 OpenClaw 生产 Gateway,把环境落在 MACCOME Mac mini(M4 / M4 Pro)与六国弹性租期上,通常比在合盖笔记本上与 probe 超时搏斗更省总成本;公开档位可先对照多地区节点与租期指南,再与 SSH 常驻 Runbook 串联拓扑。