2026 OpenClaw 安装后第一站
doctor、Gateway 健康检查与 macOS/Linux/WSL2 分平台排错

约 15 分钟阅读 · MACCOME

已经按教程装完 OpenClaw,却卡在「命令能跑、Gateway 不活」「模型连不通」「WSL2 里路径对但守护进程起不来」的开发者,需要的是装后验证与分症状排错,而不是再把安装步骤抄一遍。本文与站内《三平台安装》《Docker 生产篇》《进阶 Secrets/PDF》分工明确:只给你症状对照表、六步验证 Runbook、三条硬口径,并单独拆出 WSL2 与 macOS/Linux 原生环境的差异点。

装完不等于可用:五个会把排错带偏的痛点

OpenClaw 这类需要常驻 Gateway、模型出口与本地守护进程协同的系统,失败模式往往是「组件各自看似正常、组合起来不可用」。线上排障时还要区分一次性配置错误间歇性网络与电源策略问题。先把下面五类痛点对齐,再查表与跑步骤。

  1. 把「安装成功」当成「服务健康」:包已装上但进程未注册、端口未监听或健康检查未通过,自动化仍会随机失败。
  2. API 密钥与出口混为一谈:密钥有效但公司代理、防火墙或地区策略阻断模型端点,会表现为超时而非 401。
  3. 忽略 Gateway 绑定与回环:只监听 127.0.0.1 或只监听容器网络时,宿主机与其它进程的访问路径会与直觉相反。
  4. Windows 上混淆 WSL2 与原生:同一仓库在 DrvFS 与 ext4 上 I/O 与 inotify 行为不同,守护进程与路径会「看起来一样、跑起来不一样」。
  5. 日志只看最后一行:模型、Gateway、守护三层日志时间戳若不对齐,会误判根因;需要按层级过滤。

分症状对照:先归类再动手

下表用于值班与自检,具体子命令以你当前安装的 OpenClaw 版本文档为准;若 CLI 提供 doctor 或等价自检入口,应优先跑通再深入。

你看到的症状更可能的方向建议先做
进程起不来 / 立即退出Node 版本、权限、工作目录不在预期路径对照官方最低 Node 要求;用 doctor;检查安装用户与数据目录权限
Gateway 端口无响应绑定地址、端口占用、或被防火墙拦截确认监听地址;本机 curl 健康 URL;检查本机与上游安全组
模型超时或流中断出口、DNS、代理、地区限制或配额用最小请求验证连通;换网络排除代理;核对配额与端点区域
仅 WSL2 异常、Linux 实体机正常文件系统性能、网络虚拟化、systemd 与用户态差异仓库放 WSL 原生 ext4;避免跨系统盘海量小文件;核对 systemd/genie 方案
睡眠/更新后失联笔记本能源策略与守护未恢复电源与休眠策略;守护是否随用户会话退出;是否需要独立主机
bash
# 装后自检(示例:名称以你安装的 CLI 为准)
openclaw doctor
# 对 Gateway 本机探活(健康检查路径以实际配置为准)
curl -fsS "http://127.0.0.1:${OPENCLAW_GATEWAY_PORT:-PORT}/health" || true
warning

WSL2:/mnt/c 下跑大量构建或监听文件变化,往往比在 Linux 文件系统里更慢且更容易丢事件;长期跑 Gateway 建议把仓库与数据目录放在 WSL 的 Linux 分区,并单独验证 systemd/用户会话生命周期。

六步装后验证 Runbook(可贴进值班手册)

下列步骤与《Docker 生产篇》中的健康检查思路一致,但面向「裸机或混合安装」也适用:目标是让每一条验收都可重复执行。

  1. 冻结版本三元组:记录 OpenClaw 版本、Node 主版本、操作系统补丁级别;升级时三项一起评估。
  2. 跑 doctor 或等价自检:把所有「警告」分类成配置类、网络类、权限类,再逐项消项。
  3. 验证模型最小调用:用最小 prompt 与超时阈值测试;区分认证错误、配额错误与网络错误。
  4. 验证 Gateway 监听与健康检查:本机回环探活通过后再测跨进程;若走反向代理,对齐 Host 头与路径前缀。
  5. 验证守护进程生命周期:macOS launchd、Linux systemd、Windows 服务或用户登录项是否与预期一致;断网重连后是否自恢复。
  6. 写一页「已知症状索引」:把高频报错原文、对应修复链接到内部 wiki,减少重复踩坑。

三条应写进变更单的「硬核」口径

下列口径不替代官方文档,但能把评审与值班对齐到同一套事实。

  1. Node 与运行时边界:明确「支持的 Node 主版本区间」与「仅 LTS」策略;超出区间先降级 Node 再谈业务 bug。
  2. 健康检查定义:HTTP 200 与业务就绪不是一回事;写明探针路径、超时、是否依赖模型连通。
  3. 日志分级与保留:Gateway 与模型客户端日志默认级别、落盘路径、轮转策略;避免生产长期开 debug 撑爆磁盘。

为什么「笔记本上能跑」不等于「能当生产 Gateway」

个人笔记本合盖休眠、系统更新与权限弹窗都会打断常驻进程;WSL2 与原生 Windows 的路径与网络栈差异还会放大排障成本。若你要把 OpenClaw 的 Gateway 当成可被团队依赖的执行面,独占、可值班、可验收的 Apple Silicon 主机通常比「随手一台开发机」更省总账。

MACCOME 提供多地区可租用的远程 Mac 物理节点,适合把 Gateway 与自动化工作流放在稳定常驻的执行层;当你已经读完《三平台安装》《Docker 生产篇》仍卡在睡眠与守护恢复,下一步只需在帮助中心核对接入方式,并在价格与区域页对齐套餐即可。

若你短期仍在笔记本上调试,建议至少完成本文六步验证并把健康检查写进脚本;一旦要接入团队 CI 或 7×24 Agent,再评估迁移到专用远程 Mac,而不是无限堆本地 workaround。

常见问题

OpenClaw 安装教程已经写了命令,还需要这篇吗?

需要。《三平台安装与部署指南》解决「怎么装」;本文解决「装完怎么证明健康」与分症状排错。

Docker 生产篇和本文会不会重复?

不重复。《Docker 与 Gateway 生产篇》侧重镜像与 Compose;本文侧重装后自检、探活与 WSL2/原生差异。

进阶 Secrets 那篇要先读吗?

治理与通道可见《进阶实战清单》;若仍连不上模型,先按本文表格排除网络与密钥,再回到进阶篇做轮换与审计。需要稳定常驻执行面时可对照 租赁价格说明