Once your OpenClaw Gateway is healthy, the next reliability layer is scheduled work: channel probes, housekeeping, and recurring reports. This guide defines pre-flight gates, a minimal openclaw cron loop (when your CLI exposes it), UTC-first timezone rules, and a cold-start checklist after restarts, including why a dedicated remote Mac is a better home for always-on automation.
Make “ready to schedule” an explicit gate, not a default.
| Check | Pass | If fail |
|---|---|---|
| Gateway | openclaw gateway status healthy | fix bind/service first |
| Disk | >20% free on log volume | rotate or expand |
| Doctor | no blocking findings | resolve tokens/config drift |
| Channels | probe succeeds | do not schedule channel-dependent jobs yet |
Assume your build ships openclaw cron subcommands aligned with community docs (cron list, cron status). Order: list → status → enable one job → watch one fire → document. Capture stdout for upgrades.
Store schedules in UTC; print offsets in logs. For “09:00 weekday” rules, name the city whose 09:00 you mean.
Tip: snapshot openclaw cron list before and after each upgrade.
Verify process, registrations, and last-fired timestamps. If timestamps stall, inspect disk and permissions before blaming the scheduler. Cross-read the Gateway troubleshooting runbook.
Laptops sleep; servers should not. Colocating Gateway and scheduled jobs on dedicated Apple Silicon removes power-policy noise. See the unattended launchd/systemd checklist.
Use OS cron for machine hygiene; use OpenClaw schedulers for tasks that need session context and channel credentials. Serialize with locks if both touch the same script.
openclaw gateway status openclaw doctor openclaw cron list || true openclaw cron status || true openclaw logs --follow
OS cron lacks first-class awareness of OpenClaw session state and channel tokens; upgrades can silently break wrapper scripts. MACCOME dedicated remote Macs give stable power, disks, and regions so Gateway plus schedules stay boringly correct.
Les sondes doivent être peu coûteuses et idempotentes. Le housekeeping limite logs/caches sans partager l’état utilisateur. Les flux métier exigent propriétaire, budget de retry et clé d’idempotence.
Backoff exponentiel + jitter, distribution HTTP par job, détection précoce des 429. Séparer trafic interactif et batch LLM.
Exemple : digest quotidien terminé sous 15 minutes après l’heure UTC prévue ; alerter aussi si aucun log de succès.
Secrets à moindre privilège, périmètres de canaux réduits, sauvegardes avant upgrade. Opérations destructrices avec validation humaine.
Double exécution à demi-fréquence, comparaison de métriques pendant deux semaines, puis coupure. Pas d’écriture double sans verrou.
Enchaînez enqueue, ramassage worker, envoi canal, appel modèle et persistance avec un run_id stable. Mesurez profondeur de file et âge du plus ancien job ; CPU plat avec file qui croît oriente vers API externes ou verrous.
Les portables en veille ratent des minutes ; les VM figées idem. Placez l’ordonnanceur faisant foi sur un hôte toujours éveillé et documentez les rattrapages contrôlés. Contrôlez la santé NTP chaque semaine.
Sur du matériel partagé, chaque reboot se négocie. Isoler Gateway+cron sur un Mac distant dédié clarifie les fenêtres et les snapshots avant upgrade majeur. Les nœuds exclusifs MACCOME réduisent volontairement l’entropie opérationnelle.
Surface d’impact, rollback, dépendances, mode dry-run ; revue trimestrielle pour éviter playbooks obsolètes.
FAQ
Jobs vanished after upgrade?
Diff config volumes and re-run doctor. Public entry: home.
Conflict with systemd timers?
Partition scripts or add file locks; keep business semantics in OpenClaw.
Disk full, no logs?
Fix log rotation and mounts before raising cadence.