已在线上跑 OpenClaw 的团队在 2026 年面对频繁发版时,最怕三件事:latest 漂移、状态目录没备份就升、Gateway 停错顺序导致令牌与卷不一致。本文不写从零安装,而是与《三平台安装》《Docker 生产》《装后排错》《Linux systemd + Tunnel》分工,给出痛点拆解、本机与容器双路径对照表、症状—回滚矩阵、备份命令片段、六步升级 Runbook、三条值班口径;需要治理 Secrets 与暴露面时继续读《进阶实战》。
安装篇解决「怎么装」;Docker 生产篇解决「怎么常驻与排常见容器错」;装后排错篇解决「装完跑不起来按症状查」;Linux+Tunnel 篇解决「裸机 systemd + 不回网暴露」。📌 本篇只覆盖「已在跑」的前提下的升级、换机、换部署形态与回滚——把变更单写成可签字版本。下面六类痛点在真实值班里最高频,建议直接粘进变更描述。
latest 或浮动标签,回滚时找不到可复现的上一版 digest。~/.openclaw(或文档指定目录)里的密钥、工作区与网关配置未随卷一并快照。用于评审「这一版到底走哪条路径升」,避免口头约定。具体字段名以你当前 fork/发行说明为准。
| 维度 | 本机路径 | Docker Compose 路径 |
|---|---|---|
| 版本锚点 | 锁 npm/pnpm 版本与 lockfile;记录 Node 小版本 | 锁镜像 tag 或 digest;禁止 silent latest |
| 状态落点 | ~/.openclaw 与本地工作区路径 | bind mount / 命名卷映射到宿主机路径 |
| 密钥与令牌 | 环境变量、钥匙串或 .env(勿入库) | .env、Docker secrets 或编排侧变量;升前导出备份 |
| 健康检查 | CLI / 本地端口探活 | compose ps、容器内健康命令与宿主机端口 |
| 回滚抓手 | 重装指定包版本 + 还原目录 tar | 回退镜像 digest + 还原卷快照 |
与《装后排错》互补:这里强调升级窗口内的决策顺序。若涉及 Control UI 与公网暴露,仍需对齐《进阶实战》里的暴露面策略。
| 症状 | 优先怀疑 | 先做 | 仍失败再 |
|---|---|---|---|
| Gateway 重启循环 | 绑定地址与 UI 白名单未对齐 | 改 loopback 绑定或补齐 allowedOrigins 类配置后重试 | 回退上一镜像 digest 并还原卷快照 |
| 配对 / 设备授权异常 | 双实例并行或令牌轮换未通知客户端 | 确保旧实例完全停止;用 CLI 列设备并按官方流程重配 | 从备份恢复旧令牌文件并短暂回滚版本 |
| 模型连通超时 | 出口、代理或密钥变更 | 在容器内/宿主机分别 curl 探活;轮换密钥最小化试跑 | 对照供应商状态页与防火墙策略 |
| 磁盘暴涨后升级失败 | 工作区与日志无轮转 | 清日志前先快照;升前预留 ≥ 官方建议的剩余空间 | 扩盘或迁工作区到独立卷 |
# 例:升级前打包状态目录(路径以你环境为准;勿把压缩包提交到 git) tar czf openclaw-state-$(date +%Y%m%d).tgz -C "$HOME" .openclaw # Compose:在 .env 或 compose 中固定镜像 digest / 次要版本号,再执行 pull & up # docker compose pull && docker compose up -d
注意:任何包含密钥的备份文件权限应限制在运维角色;恢复后应轮换仍可能暴露的令牌,并与《进阶实战》中的 Secrets 审计节奏一致。
.env 的安全副本(脱敏存审计库)。补充:当团队同时在笔记本与服务器上各跑一份 Gateway 时,建议在监控里给实例加明确标签,否则告警里只会写「down」却分不清该切哪条 DNS;这与《Docker 生产》里强调的令牌与暴露面合同是同一件事的延伸。
笔记本睡眠、系统更新与不可预期的磁盘占用会把「升级窗口」变成随机事件;临时 VPS 若未做快照与租期对齐,回滚时往往缺一块盘。要把 Gateway 当生产组件,需要可预期的在线时间、可恢复的磁盘与可选择的地区,并把升级 Runbook 与监控绑定。
个人设备与碎片化主机还难与团队 Secrets 治理、审计留痕对齐:谁最后一次改了令牌、哪台机器在跑 digest X,常常说不清。MACCOME 在多地区提供 Mac Mini M4 / M4 Pro 物理节点与弹性租期,适合作为 OpenClaw 稳定执行层或专用 Gateway 宿主;与《多地区节点与租期指南》《SSH 与 VNC 接入决策》一起评审后,可在价格页对齐套餐并在帮助中心核对接入与账单口径。
若仍处试点阶段,建议先用短租在目标区域跑通备份—升级—回滚演练,再决定是否把基线迁到月租或季租,避免把未验证的 Runbook 直接绑在长期合同上。