2026 OpenClaw — сопровождение обновления: openclaw backup create, лестница приёмки и триаж ACP / gateway probe

около 19 мин чтения · MACCOME

Перед или сразу после OpenClaw openclaw update / обновления образа: Control UI открывается, но gateway probe — timeout, или регресс ACP / device-потока CLI с 2026.3.13+? Технический runbook: ① механизм openclaw backup create до окна; ② лестница status → gateway status → gateway probe → doctor для критерия «в прод / откат»; ③ триаж probe / WebSocket 1006 / ACP «queue owner unavailable». Дополняет чеклист миграции и digest rollback—здесь только backup + приёмка probe/ACP.

Шесть типичных ошибок обновления (механизм, затем действие)

  1. Смена tag образа без backup create: нет воспроизводимого снимка pairing/каналов «последнего хорошего» состояния.
  2. Dashboard открыт ⇒ probe зелёный: в 2026 daemon может быть healthy, loopback probe — timeout (Windows: provider-плагины замедляют старт процесса Gateway).
  3. Node не на базе 24: upstream рекомендует Node 24; на 22.x часто расходятся handshake CLI и Gateway—см. runbook Node 24.
  4. «Полуобновление» split-brain: CLI новой версии, процесс Gateway без reload—симптомы как у tools.profile, корень — не загруженный runtime.
  5. Регресс ACP списывают на модель: при сбое bridge/device 2026.3.x прямой acpx на хосте может работать—сначала триаж ACP, не смена модели.
  6. Окно на ноутбуке со сном: probe красный ≠ плохая версия; авторитетный Gateway — на постоянно включённом удалённом Mac, SSH forward.

В документации 2026 обновление — это обратимая миграция состояния (~/.openclaw или bind-mount в Docker), а не разовый npm install -g. Команда openclaw backup create формирует именованный архив дерева состояния: при повторном timeout probe или потере регистрации ACP восстановление до комбинации «до обновления» укладывается в минуты, если заранее зафиксированы tag/digest в матрице pin (бинарник) и есть backup (runtime + pairing).

Механизм backup: CLI упаковывает каталог состояния с метаданными версии (точные поля — в выводе backup --help вашего канала). Ручной tar без официальной команды может не захватить инкрементальный индекс—в проде первичен backup create. Архив обычно содержит токены: хранить отдельно от sync-папок, не прикладывать к тикету целиком; restore проверять в изолированном контуре.

Уже есть в блоге Этот материал Не дублируем
Чеклист миграции backup create + лестница probe Полный перенос каталогов, switch multi-Gateway
Digest rollback Когда откатывать после probe Пошаговый compose pull / digest
Триаж tools.profile Минимальная sonde на шаге 5 Три слоя allowlist
Gateway без ответа probe после исключения «тишина» OAuth каналов, routing моделей

До обновления: openclaw backup create и чеклист каталогов

Последовательность до окна: backup → отпечаток версий → один авторитетный процесс Gateway. Имена подкоманд могут отличаться по каналу release—эталон openclaw backup --help; инвариант: без локального архива нет prod-обновления.

В тикете фиксируйте: openclaw --version, node -v, image tag/digest, тип хоста (npm / compose / remote). Это связывает MTTR с конкретной восстановленной комбинацией и исключает «слепой» откат на неизвестный конфиг.

bash
openclaw --version
node -v   # цель: v24.x

openclaw backup create
ls -la ~/.openclaw/backup 2>/dev/null || ls -la "${OPENCLAW_STATE_DIR:-$HOME/.openclaw}/backup"

openclaw gateway status
openclaw config get gateway.auth.token 2>/dev/null | head -c 8; echo "…(скрыто)"
Проверка npm локально Docker Compose Удалённый Mac 24/7
Каталог состояния ~/.openclaw вне iCloud/sync bind-mount на фиксированный путь хоста OPENCLAW_STATE_DIR на выделенном томе
Состав backup Часто token + pairing; шифрование, журнал доступа, rotation после restore
Двойной Gateway launchd + ручной compose + хост на 18789 forward с ноутбука + процесс на remote
Диск df -h: свободно ≥ 2× размер дерева состояния
warning

Важно: только tar ~/.openclaw может пропустить метаданные backup-подсистемы. В проде: backup create; tar — вторая холодная копия на другом носителе.

Лестница приёмки: от status до «можно в прод»

После обновления не закрывать change по одному сообщению в чате. Фиксированная цепочка проверок—падение шага останавливает дальнейшие действия, stderr и версия в тикет:

  1. openclaw status — CLI читает конфиг
  2. openclaw gateway status — процесс, порт, bind
  3. openclaw gateway probe — loopback handshake и задержка
  4. openclaw doctor — предупреждения по зависимостям
  5. Минимальная sonde: read-only tool или channels status --probe
  6. При ACP: регистрация bridge и создание сессии

«В прод»: шаги 1–4 зелёные, шаг 5 на реально используемых каналах/инструментах. «Обязателен откат»: тот же шаг красный два тура после reload/restart при ущербе для агента → restore backup или digest rollback на задокументированный tag—не наращивать патчи на плохой minor.

На удалённом Mac: gateway probe выполнять на хосте Gateway; ноутбук — только SSH local forward. Иначе RTT/сон интерпретируются как «сломался ACP». При совпадении с пиком нагрузки — runbook дисперсии probe.

bash
openclaw status
openclaw gateway status
openclaw gateway probe
openclaw doctor

# Docker: pull/up -d, затем restart сервиса gateway
openclaw channels status --probe
Симптом Механизм (гипотеза) Первое действие
probe timeout, status healthy Старт Gateway задержан provider-plugin; гонка loopback Отключить расширение; увеличить ожидание перед probe; Windows — откат patch
WebSocket 1006 token / bind / заголовки Upgrade за reverse-proxy runbook pairing 1006; тест без proxy
ACP queue owner unavailable Регресс bridge 2026.3.x Проверить acpx на хосте; pin по issue; не менять модель первым шагом
devices list timeout Расхождение версий CLI и Gateway Выровнять версии; backup + пошаговое обновление
Канал полностью молчит Слой канала/модели runbook «нет ответа»

Матрица: донастройка vs pin/откат vs временное отключение ACP/provider

Развилка on-call: ещё один YAML или немедленный откат. Таблица по impact (строки) и действию (столбцы)—решение по симптому, не по ощущению:

Impact Донастройка Pin / откат Выключить ACP или provider
Только probe красный, каналы OK Шум мониторинга; оптимизация старта Если SLA требует зелёный probe — откат patch Отключить медленный provider-plugin
ACP недоступен, чат OK bridge / plugin discovery Известная регрессия — откат minor Временно ACP off, держать SLA каналов
probe + каналы + tools Только после restore backup, по одному шагу Приоритет restore или digest rollback Не первый выбор

Runbook из 6 шагов: backup — обновление — лестница — фиксация

  1. Тикет change: версии, tag/digest, remote Mac да/нет, путь хранения backup.
  2. backup create + чеклист: размер архива правдоподобен; каталог не в sync.
  3. Обновление: npm или compose; один шаг канала на тикет.
  4. Один reload: один процесс на авторитетном порту; не compose+launchd параллельно.
  5. Лестница 1–6: fail → лог в тикет, стоп.
  6. Закрытие или откат: зелёный → обновить таблицу «известная хорошая комбинация»; красный → restore/rollback + MTTR.

Три операционных KPI

  • MTTR обновления: медиана минут от первого fail probe до восстановленной комбинации—цель ≤15 при готовых backup/digest.
  • Доля ложноположительных probe: UI/канал OK, probe красный—>25 % за две недели → чинить старт, не слепой weekly rollback.
  • Обновления без доказательства backup: цель prod 0.

На удалённых Mac MACCOME в шести регионах не совмещайте вечерний пик, docker pull и полный набор probe—дисперсия сети маскируется под «сломался ACP». Стабильнее: постоянное питание, выделенный том, приёмка на хосте Gateway.

Итог: обновление = обратимая миграция состояния

Сообщение «работает?» или три ручных правки YAML не проходят аудит и не воспроизводятся на втором хосте. Связка backup create + лестница + триаж probe/ACP сжимает инцидент «плохая версия» до события с точкой отката и метриками (~10 минут при подготовке).

Для prod Gateway OpenClaw 7×24, Node 24, тикетируемые изменения — Mac mini M4 / M4 Pro MACCOME; гид по шести регионам + SSH runbook для топологии.

FAQ

backup create включает токены?

Обычно да—конфиденциально, rotation перед prod restore. Хост: цены аренды.

probe красный, dashboard открыт — откат?

Не обязательно—таблица симптомов; два тура лестницы с ущербом → digest rollback.

Окно на удалённом Mac?

Без полного диска и пика build; backup на выделенном томе; probe на remote. центр помощи.