Полное руководство 2026: Запуск OpenClaw и OpenHuman на арендованном Mac Mini M4 — локальный ИИ-агент 24/7

Около 20 мин чтения · MACCOME

Техническая постановка задачи на 2026 год: развернуть stateful AI-агента с локальным inference на macOS, не покупая железо и не сводя всё к Linux VPS без Metal. OpenClaw — Gateway, каналы Telegram/Discord/Slack, ClawHub skills, CLI openclaw onboard. OpenHuman v0.53 — Tauri desktop, Memory Tree, блок [local_ai] в config.toml для Ollama/LM Studio. Оба стека на арендованном Mac Mini M4 (MACCOME) дают 24/7 uptime, unified memory для Q4-моделей и контроль данных на выделенном инстансе. Ниже: сравнение архитектур, спецификации RAM, SSH/VNC, установка LaunchAgent, выбор моделей Ollama, hardening, TCO. Детали Ollama: runbook; launchd: чеклист.

Модуль 1: OpenClaw vs OpenHuman — архитектурное сравнение

OpenClaw — channel-first agent platform: процесс Gateway слушает webhooks/long polling, маршрутизирует LLM-вызовы, исполняет tools. Состояние: ~/.openclaw/, workspace, AGENTS.md. OpenHuman — memory-tree-first desktop agent: ветвящийся контекст по проектам, локальный inference через Ollama endpoint. Параметры выбора: нужен внешний Bot 24/7 → OpenClaw; нужен постоянный desktop copilot с древовидной памятью → OpenHuman.

Co-hosting на одном M4: суммируйте RSS Gateway, Ollama model resident set и Memory Tree I/O. На 16 GB — один локальный 7B максимум; второй продукт через cloud API fallback. На 32 GB — разделение ролей без swap.

Параметр OpenClaw OpenHuman v0.53
Entry point npm i -g openclaw, openclaw onboard install.sh, config.toml
Daemon launchd Gateway Tauri + background worker
Persistence Session state, skills dir Memory Tree nodes
RAM (min prod) 16 GB (API) / 32 GB (local 7B) 16 GB (7B Q4) / 32 GB (13B+)
Observability openclaw doctor, gateway logs App logs, tree size metrics

Модуль 2: Железо и регион — спецификация аренды M4

Bottleneck локального inference на Apple Silicon — unified memory bandwidth, не CPU GHz. M4 16 GB: один Q4 7B (qwen2.5:7b-instruct-q4_K_M, llama3:8b-instruct-q4_K_M). M4 Pro 64 GB: 32B quantized, multi-agent, опционально CI co-location (с мониторингом I/O). Neural Engine дополняет Metal path Ollama; ключевой выигрыш — отсутствие постоянного egress в US API.

Регион MACCOME: минимизируйте RTT до webhook endpoints (Telegram/Discord). RU/EU команды часто берут Frankfurt-adjacent или SG/HK в зависимости от аудитории. Цены: тарифы аренды; multi-region: гайд.

SKU RAM / SSD Workload Ollama example Idle power
M4 base 16 GB / 512 GB Gateway+API или OpenHuman+7B qwen2.5:7b-instruct-q4_K_M ~4–6 W
M4 upgraded 32 GB / 1 TB Dual product, один local model llama3:8b-instruct-q4_K_M ~6–15 W
M4 Pro 64 GB / 2 TB 32B, multi-agent, CI sidecar qwen2.5:32b-instruct-q4_K_M ~10–25 W

Модуль 3: Подключение cloud Mac — SSH, VNC, zero trust

Provision через оформление заказа, auth по SSH key. GUI setup OpenHuman: VNC. Gateway admin port — только loopback + ssh -L 18789:127.0.0.1:18789 или Tailscale. Disable sleep: sudo pmset -a sleep 0 displaysleep 0. Checklist: zero trust, центр помощи.

Day-0 checklist: macOS + CLT, Homebrew node@24 + ollama, disk >100 GB free, NTP sync, dedicated macOS user (не shared account для prod onboard).

Модуль 4: Install path — OpenClaw LaunchAgent и OpenHuman Memory Tree

OpenClaw pipeline

Node 24 pin → openclaw doctoropenclaw onboard (runbook). Register Ollama at http://127.0.0.1:11434/v1 as OpenAI-compatible. Complete ≥1 channel smoke test. openclaw onboard --install-daemon → verify post-reboot with openclaw gateway status.

OpenHuman pipeline

./install.sh → edit config.toml:

  • [local_ai] base_url → Ollama
  • model → pinned tag
  • context_limit → match model window

Memory Tree root: persistent path under ~/.openhuman/. Pre-return: tar czf openhuman-backup-$(date +%Y%m%d).tar.gz ~/.openhuman/.

bash
brew install ollama node@24
ollama serve &
ollama pull qwen2.5:7b-instruct-q4_K_M

npm i -g openclaw@latest
openclaw doctor && openclaw onboard
openclaw onboard --install-daemon

chmod +x install.sh && ./install.sh

ssh -L 18789:127.0.0.1:18789 user@rental-mac.example.com
openclaw gateway status

Модуль 5: Ollama models, multi-agent, security

Production defaults 2026: Qwen2.5 7B (RU/EN mix), Llama 3 8B (code), Gemma 3 4B (light always-on). OpenClaw routes to Ollama via OpenAI-compatible API — zero token opex loop. Quality ceiling ниже frontier cloud; retain API failover via multi-provider config.

Multi-agent resource rule: never load two 7B models concurrently on 16 GB — monitor memory_pressure, ollama ps. Security: CVE-2026-25253 hardening, firewall deny inbound gateway, mask tokens in logs, rotate webhooks on migration.

info

Data plane: local weights + session state on dedicated instance = reduced third-party inference exposure. Channel ingress still may contain PII — define retention + encrypted backup policy.

Модуль 6: TCO — аренда vs покупка vs cloud GPU

24-month horizon: purchase M4 16GB = capex + self-SLA + power; cloud GPU hourly = prohibitive for 24/7 agent idle+spike pattern; MACCOME rental = fixed OpEx, remote KVM, documented export. Break-even purchase typically >18 months if you value ops time.

7-day rollout schedule

  1. D1: region + SSH hardening
  2. D2: Ollama + Node 24 + model pull
  3. D3: OpenClaw onboard + Telegram test bot
  4. D4: launchd + forced reboot test
  5. D5: OpenHuman via VNC, Memory Tree smoke
  6. D6: co-run tuning — if swap, demote one stack to API
  7. D7: logrotate, disk alerts, production channel cutover

Metrics week 1: gateway uptime, Ollama p95 latency, disk (models+logs+tree). OAuth triage: channel checklist. Export: центр помощи.

warning

Zero token != zero cost: power, RAM, disk TBW, on-call human time remain. Rental bundles into predictable monthly line item.

Model 24 mo 24/7 agent fit Data control
Own M4 16GB Capex + opex Yes (self SLA) High
MACCOME rental Fixed (цены) High High (dedicated)
Linux VPS + API Variable Medium Medium
Cloud GPU High if always-on Low Low–medium

Итог: OpenClaw и OpenHuman решают разные layer стека — channels vs desktop memory — но оба требуют always-on Apple Silicon. Аренда M4 переносит capex и datacenter duty на провайдера; вы фокусируетесь на skills, Memory Tree schema и runbooks. Intelligence ≈ f(uptime hours); hardware — интеграл этой функции.

FAQ

Одновременный запуск на одном Mac Mini?

Да с 32 GB RAM; на 16 GB один стек через API.

Зачем локальный inference на аренде?

Контроль данных на dedicated macOS. Цены аренды.

Почему не ноутбук?

Sleep убивает Gateway и Memory Tree. Аренда Mac.

Export перед возвратом?

tar ~/.openclaw/ + OpenHuman; rotate tokens. Центр помощи.