Once your OpenClaw Gateway is healthy, the next reliability layer is scheduled work: channel probes, housekeeping, and recurring reports. This guide defines pre-flight gates, a minimal openclaw cron loop (when your CLI exposes it), UTC-first timezone rules, and a cold-start checklist after restarts, including why a dedicated remote Mac is a better home for always-on automation.
Make “ready to schedule” an explicit gate, not a default.
| Check | Pass | If fail |
|---|---|---|
| Gateway | openclaw gateway status healthy | fix bind/service first |
| Disk | >20% free on log volume | rotate or expand |
| Doctor | no blocking findings | resolve tokens/config drift |
| Channels | probe succeeds | do not schedule channel-dependent jobs yet |
Assume your build ships openclaw cron subcommands aligned with community docs (cron list, cron status). Order: list → status → enable one job → watch one fire → document. Capture stdout for upgrades.
Store schedules in UTC; print offsets in logs. For “09:00 weekday” rules, name the city whose 09:00 you mean.
Tip: snapshot openclaw cron list before and after each upgrade.
Verify process, registrations, and last-fired timestamps. If timestamps stall, inspect disk and permissions before blaming the scheduler. Cross-read the Gateway troubleshooting runbook.
Laptops sleep; servers should not. Colocating Gateway and scheduled jobs on dedicated Apple Silicon removes power-policy noise. See the unattended launchd/systemd checklist.
Use OS cron for machine hygiene; use OpenClaw schedulers for tasks that need session context and channel credentials. Serialize with locks if both touch the same script.
openclaw gateway status openclaw doctor openclaw cron list || true openclaw cron status || true openclaw logs --follow
OS cron lacks first-class awareness of OpenClaw session state and channel tokens; upgrades can silently break wrapper scripts. MACCOME dedicated remote Macs give stable power, disks, and regions so Gateway plus schedules stay boringly correct.
Sonden müssen billig und idempotent sein. Housekeeping rotiert Logs und räumt Caches, ohne Nutzerzustand zu teilen. Business-Flows brauchen Owner, Retry-Budgets und Idempotenzschlüssel.
Exponentielles Backoff mit Jitter, HTTP-Statusverteilung pro Jobname loggen, 429-Drift früh erkennen. Modell-Traffic trennen.
Definieren Sie z. B. Fertigstellung innerhalb von 15 Minuten nach UTC-Trigger; alarmieren Sie auch auf ausbleibende Erfolgslogs.
Mindestprivileg getrennt von Admin-CLI, enge Channel-Scopes, Backups vor Upgrades. Destruktives nur mit Freigabe.
Halbfrequente Doppelspur, Metrikvergleich über zwei Wochen, dann Abschaltung. Kein doppeltes Schreiben ohne Lock.
Verketten Sie Enqueue, Pickup, Kanalversand, Modellaufruf und Persistenz mit stabilen run_id-Feldern. Messen Sie Warteschlangentiefe und älteste Wartezeit; bleibt die CPU flach bei wachsender Tiefe, liegt das Problem selten an der Inferenz, sondern an APIs oder Locks.
Notebooks im Sleep und pausierte VMs verpassen Minutengrenzen. Verlegen Sie autoritative Scheduler auf dauerhaft wache Hosts und dokumentieren Sie Nachhollogik statt stiller Doppelfeuer. NTP-Health wöchentlich prüfen.
Geteilte Entwicklerhardware macht jeden Neustart zum Koordinationsproblem. Dedizierte Remote-Macs vereinfachen Freeze-Fenster und Snapshots vor Major-Upgrades. MACCOME-Regionen bieten bewusst langweilige, single-tenant Silizium-Kapazität.
Blast Radius, Rollback, Abhängigkeiten und Dry-Run-Flags vierteljährlich prüfen, damit veraltete Playbooks keine stillen Regressionen nähren.
FAQ
Jobs vanished after upgrade?
Diff config volumes and re-run doctor. Public entry: home.
Conflict with systemd timers?
Partition scripts or add file locks; keep business semantics in OpenClaw.
Disk full, no logs?
Fix log rotation and mounts before raising cadence.