Кому это нужно: OpenClaw Gateway и каналы выглядят «онлайн», но со стороны пользователя долго нет текстового ответа, а в логах повторяются 429, переполнение контекста, модель недоступна, инструмент не зарегистрирован и сходные ошибки очереди или модели. Вывод статьи: официальный Gateway Troubleshooting не читать фрагментарно, а превращать в выполняемый по слоям порядок; установка и Compose остаются в «гайде на три платформы» и «продакшен-Docker», сеть и CLI — в «Docker-сеть и CLI», рукопожатие каналов — в «OAuth каналов». Структура: шесть типичных заблуждений → таблица решений по слоям → таблица проверок → фрагменты команд → шестишаговый runbook → три KPI → вывод про постоянный удалённый хост.
«Нет ответа» в эксплуатации чаще всего — наложение сбоев на разных уровнях: процесс запущен, health зелёный, reverse proxy отдаёт 200, но квота модели исчерпана, контекст отклонён или очередь перегружена и воркер перестаёт забирать работу. Ниже шесть распространённых ошибок разбора на дежурстве; если идти по списку, удаётся отсечь большую долю бессмысленных перезапусков.
memory_search, см. «Skills и memory_search».openclaw doctor уместен как снимок базовой линии после изменения конфигурации; каждый инцидент с нуля в режиме deep маскирует регрессии. Связка с «doctor после установки»: после установки, после апгрейда, при инциденте «нет ответа».Официальный Troubleshooting обычно предлагает сначала убедиться в связности Gateway и модели, затем углубляться в каналы и инструменты; здесь тот же порядок оформлен как приложение к ревью — его можно привязать к runbook и номеру заявки на изменение.
На практике «нет ответа» грубо делится на жёсткий отказ (явные 4xx/5xx и стеки) и мягкий отказ (логи спокойны, вывода нет); при мягком отказе в первую очередь смотрят очередь, таймауты и пороги контекста, при жёстком — ключи, маршрут и reverse proxy.
Исключайте уровни сверху вниз; пока один слой не закрыт, не меняйте одновременно все четыре — иначе откат превращается в лавину.
| Слой | Типичные симптомы | Приоритетные доказательства | Следующий шаг |
|---|---|---|---|
| Процесс / контейнер | Порт недоступен, процесс падает по кругу | код выхода контейнера, журналы systemd/launchd | Вернуться к гайду по установке и продакшен-Docker; проверить ресурсы и монтирование томов |
| Reverse proxy / TLS / WS | в браузере периодические 502, обрывы WS | access/error у прокси, заголовок Upgrade | Пройти чеклист TLS и WebSocket пункт за пунктом |
| Канал | канал «подключён», сообщения не попадают в тред | события на стороне канала, OAuth scope | Чеклист OAuth; исключить приватность и белые списки каналов |
| Модель / очередь | в логах запрос без completion, текст про 429 | статус провайдера, квоты, журнал маршрутизации | Проверить маршрут и деградацию; при необходимости снизить параллелизм и контекст |
Ниже — каркас по шагам, которые встречаются в документации и у сообщества; точные подкоманды сверяйте с openclaw --help вашей версии. Цель — привязать действие к строке лога, а не перезагружать узел наугад.
| Проверка (концепт) | Отпечаток в логах / поведении | Пояснение |
|---|---|---|
| Здоровье / статус Gateway | проба готовности падает, status в CLI с ошибкой | Сначала адрес прослушивания и сеть compose, затем модель |
| Проба связи с моделью | timeout, 401, 403, 429 | 401/403 — ключ и проект; 429 — квоты и политика охлаждения маршрута |
| doctor (глубокий режим) | дрейф конфигурации, несуществующие пути, skew версий | После апгрейда или слияния конфигов обязателен; вывод прикладывайте к заявке |
| Очередь / backpressure (если применимо) | рост очереди запросов, задержка без кода ошибки | Снижение параллелизма, масштабирование или сдвиг пиков; сопоставлять с загрузкой CPU на удалённой машине |
Сохраняйте вывод во вложение к тикету; чувствительные строки обезличивайте перед передачей стороне. Флаги уточняйте локально через openclaw --help.
# Базовая линия: после апгрейда или смены конфигурации — по одному прогону и архив openclaw doctor openclaw doctor --deep --yes # При воспроизведении: зафиксировать время и идентификатор запроса (если есть в логах) # tail -n 200 /path/to/gateway.log | tee ./incident-$(date +%Y%m%d%H%M).log # Сверка маршрутизации моделей: в статье про несколько провайдеров поочерёдно отключайте неосновные
Замечание: если одновременно меняются таймауты reverse proxy, max_tokens у модели и политика повторов канала, причину не восстановить; на инцидент меняйте один слой и в выводе doctor фиксируйте diff до/после.
Снимите окно логов Gateway на 30 секунд и найдите фрагменты ответа провайдера; при long context или 429 выполните охлаждение и деградацию по материалу про провайдеров, затем оцените задержку до первого токена.
В первую очередь WebSocket за reverse proxy и OAuth каналов; если UI идёт через localhost, а каналы — через публичное имя, часто виновато расхождение двух входов: нанесите оба пути на одну схему и сверяйте по ней.
Инженерная оценка (не бенчмарк): в цикле 2025–2026 при типичном включении нескольких провайдеров и длинного контекста доля инцидентов «нет ответа» из-за очередей и квот в публичных обсуждениях остаётся высокой; TTFT и 429 на одной временной оси объясняют «почему вчера замолчали все», лучше, чем один только CPU.
Отдельная цепочка, которую часто упускают: корпоративный прокси и подмена сертификатов даёт сочетание «HTTPS-проба к модели прошла, длинное соединение рвётся». Сверяйте выход Gateway и выход рабочей станции разработчика в одном окне захвата; не списывайте сетевую политику на дефект версии OpenClaw. Когда в приложении к «Docker-сети» зафиксированы белые списки прокси, SNI и совместимость HTTP/2, дежурному достаточно проверить «совпадает ли egress».
Если одновременно используются self-hosted модели и облачные API, в ревью изменений имеет смысл требовать двухстековую таблицу маршрутизации: какая сессия каким ключом идёт и при каком условии срабатывает fallback; иначе «нет ответа» чаще следствие отсутствия таблицы, а не опечатки в одном поле. Версионируйте таблицу вместе с базовой линией doctor, чтобы устные договорённости не терялись при смене ответственных.
Сон, переключение маршрута и политика корпоративного выхода превращают «нет ответа» в плохо воспроизводимый эффект; продакшену нужны стабильный egress, воспроизводимый порядок перезапуска и аудируемые пути логов. Самодельный мини-ПК часто без глобальной доступности и с запасом по диску и каналу; в пике очередь модели и повторы канала начинают мешать друг другу.
Командам, которые рассматривают OpenClaw как круглосуточный вход автоматизации, разумнее разместить Gateway на облачном Mac с выделенным Apple Silicon, выбором региона и гибким сроком аренды, а этот runbook связать с постоянным чеклистом эксплуатации в ревью изменений. MACCOME предлагает Mac Mini M4 / M4 Pro в Сингапуре, Японии, Корее, Гонконге, на востоке и западе США — удобно для фиксации reverse proxy, постоянных каталогов и мониторинга; перед заказом сверьтесь с публичным описанием аренды и центром помощи.
Пилот: краткосрочно возьмите узел в том же регионе, что и основные пользователи, проведите полную репетицию шести шагов runbook, затем решайте вопрос помесячной аренды и расширения диска.
Дисциплина документации: после закрытия каждого инцидента «нет ответа» заносите метку причины и шаблон строки лога во внутреннюю базу; перед следующим релизом проверяйте, что паттерн по-прежнему покрыт мониторингом. Тогда при обновлении официального Troubleshooting вы сможете diff-ить свои дополнения, а не переписывать runbook с нуля каждый год.
Вопросы
После апгрейда пропал ответ: с чего начать?
Сначала openclaw doctor --deep --yes и сравнение с базовой линией до обновления; если doctor чистый, спускайтесь по четырёхслойной таблице сверху вниз, начиная с reverse proxy. Справка и сессии — в центре помощи.
В логе уже есть сбой вызова tool — нужна ли эта статья?
Если модель вернула план и дошла до инструмента, но выполнение упало, откройте MCP и ClawHub; здесь основная линия — «модель не выдаёт вывод» или «очередь не потребляется».
На удалённом Mac путь к логам каждый раз другой — что делать?
Зафиксируйте каталог логов и ротацию в операционной таблице и согласуйте с чеклистом постоянного удалённого Mac; при выборе площадки опирайтесь на тарифы аренды и региональные страницы, плюс центр помощи.