2026 OpenClaw 版本升级与运行态迁移
配置目录备份、Gateway 切换与回滚一步一检(Docker / 本机)

约 18 分钟阅读 · MACCOME

已在线上跑 OpenClaw 的团队在 2026 年面对频繁发版时,最怕三件事:latest 漂移、状态目录没备份就升、Gateway 停错顺序导致令牌与卷不一致。本文不写从零安装,而是与《三平台安装》《Docker 生产》《装后排错》《Linux systemd + Tunnel》分工,给出痛点拆解、本机与容器双路径对照表、症状—回滚矩阵、备份命令片段、六步升级 Runbook、三条值班口径;需要治理 Secrets 与暴露面时继续读《进阶实战》。

本文解决什么:与站内既有 OpenClaw 系列怎么分工

安装篇解决「怎么装」;Docker 生产篇解决「怎么常驻与排常见容器错」;装后排错篇解决「装完跑不起来按症状查」;Linux+Tunnel 篇解决「裸机 systemd + 不回网暴露」。📌 本篇只覆盖「已在跑」的前提下的升级、换机、换部署形态与回滚——把变更单写成可签字版本。下面六类痛点在真实值班里最高频,建议直接粘进变更描述。

  1. 镜像或包版本漂移:生产用 latest 或浮动标签,回滚时找不到可复现的上一版 digest。
  2. 只备份仓库不备份状态:~/.openclaw(或文档指定目录)里的密钥、工作区与网关配置未随卷一并快照。
  3. 停机顺序错误:先杀容器再导出卷,或先改 DNS 再停旧 Gateway,导致双写与配对状态错乱。
  4. 本机与容器混用路径:同一主机上 npm 与 Compose 争用端口或读写同一目录,升级后「以为迁完了」其实仍在读旧路径。
  5. 冷升级无验证用例:升完只看进程在,不做最小模型调用与 Control UI 登录验证。
  6. 回滚只降版本不还原卷:新版本已改 schema 或工作区文件,旧二进制回来仍炸,需要卷级还原策略。

表 1:本机(npm/脚本)与 Docker Compose:升级维度对照

用于评审「这一版到底走哪条路径升」,避免口头约定。具体字段名以你当前 fork/发行说明为准。

维度本机路径Docker Compose 路径
版本锚点npm/pnpm 版本与 lockfile;记录 Node 小版本锁镜像 tag 或 digest;禁止 silent latest
状态落点~/.openclaw 与本地工作区路径bind mount / 命名卷映射到宿主机路径
密钥与令牌环境变量、钥匙串或 .env(勿入库).env、Docker secrets 或编排侧变量;升前导出备份
健康检查CLI / 本地端口探活compose ps、容器内健康命令与宿主机端口
回滚抓手重装指定包版本 + 还原目录 tar回退镜像 digest + 还原卷快照

表 2:症状 → 优先动作(含回滚与绑定类提示)

与《装后排错》互补:这里强调升级窗口内的决策顺序。若涉及 Control UI 与公网暴露,仍需对齐《进阶实战》里的暴露面策略。

症状优先怀疑先做仍失败再
Gateway 重启循环绑定地址与 UI 白名单未对齐改 loopback 绑定或补齐 allowedOrigins 类配置后重试回退上一镜像 digest 并还原卷快照
配对 / 设备授权异常双实例并行或令牌轮换未通知客户端确保旧实例完全停止;用 CLI 列设备并按官方流程重配从备份恢复旧令牌文件并短暂回滚版本
模型连通超时出口、代理或密钥变更在容器内/宿主机分别 curl 探活;轮换密钥最小化试跑对照供应商状态页与防火墙策略
磁盘暴涨后升级失败工作区与日志无轮转清日志前先快照;升前预留 ≥ 官方建议的剩余空间扩盘或迁工作区到独立卷
bash
# 例:升级前打包状态目录(路径以你环境为准;勿把压缩包提交到 git)
tar czf openclaw-state-$(date +%Y%m%d).tgz -C "$HOME" .openclaw

# Compose:在 .env 或 compose 中固定镜像 digest / 次要版本号,再执行 pull & up
# docker compose pull && docker compose up -d
warning

注意:任何包含密钥的备份文件权限应限制在运维角色;恢复后应轮换仍可能暴露的令牌,并与《进阶实战》中的 Secrets 审计节奏一致。

六步升级 Runbook(可贴进变更系统)

  1. 读发行说明:标注 breaking change、数据库/工作区 schema 迁移脚本与最低 Node/内核要求。
  2. 冻结版本锚点:写入镜像 digest 或包版本号;禁止在生产窗口内顺手改 latest。
  3. 冷备份:状态目录 tar、compose 使用的卷或绑定路径、以及当前 .env 的安全副本(脱敏存审计库)。
  4. 维护窗内切换:先停流量入口(反代 / Tunnel)再停旧 Gateway;启新实例后做健康检查再恢复入口。
  5. 验证:CLI 状态、Gateway 日志无异常、Control UI 登录、最小模型对话用例各一次。
  6. 记录与收尾:成功则更新运维文档中的版本与 digest;失败则执行表 2 回滚支路并开事故单。

三条应写进值班的「硬核」口径

  1. 可复现锚点是否存在:任意生产环境必须能回答「当前运行的 digest/包版本号是什么」,否则不算升级完成。
  2. 备份校验:tar 或卷快照恢复演练至少季度一次;只做过备份没做过还原等于没备份。
  3. 升级—回滚时间预算:维护窗长度应覆盖「验证失败 + 完整还原」的最坏路径,而不是只覆盖 happy path。

补充:当团队同时在笔记本与服务器上各跑一份 Gateway 时,建议在监控里给实例加明确标签,否则告警里只会写「down」却分不清该切哪条 DNS;这与《Docker 生产》里强调的令牌与暴露面合同是同一件事的延伸。

仅依赖个人电脑或临时 VPS 做长期 Gateway 的局限

笔记本睡眠、系统更新与不可预期的磁盘占用会把「升级窗口」变成随机事件;临时 VPS 若未做快照与租期对齐,回滚时往往缺一块盘。要把 Gateway 当生产组件,需要可预期的在线时间、可恢复的磁盘与可选择的地区,并把升级 Runbook 与监控绑定。

个人设备与碎片化主机还难与团队 Secrets 治理、审计留痕对齐:谁最后一次改了令牌、哪台机器在跑 digest X,常常说不清。MACCOME 在多地区提供 Mac Mini M4 / M4 Pro 物理节点与弹性租期,适合作为 OpenClaw 稳定执行层或专用 Gateway 宿主;与《多地区节点与租期指南》《SSH 与 VNC 接入决策》一起评审后,可在价格页对齐套餐并在帮助中心核对接入与账单口径。

若仍处试点阶段,建议先用短租在目标区域跑通备份—升级—回滚演练,再决定是否把基线迁到月租或季租,避免把未验证的 Runbook 直接绑在长期合同上。

常见问题

升级前最不该省略的三件事是什么?

固定镜像或包版本锚点、完整备份状态目录与卷、在窗口内写清回滚责任人与验证用例。需要对照商业条款时打开 租赁价格说明帮助中心

Gateway 升级后 Control UI 异常,先看什么?

绑定地址与健康检查、Docker 场景下 loopback 与 UI 白名单类配置;本机路径查端口与令牌。详细分症状流程仍以《装后排错》为主。

和 Docker 生产篇怎么配合?

生产篇讲常驻与常见容器故障;本篇讲升级前后的备份顺序、版本锚点与回滚抓手。两文与《Docker 生产》一起放进同一份运维手册目录。