Техническая постановка задачи на 2026 год: развернуть stateful AI-агента с локальным inference на macOS, не покупая железо и не сводя всё к Linux VPS без Metal. OpenClaw — Gateway, каналы Telegram/Discord/Slack, ClawHub skills, CLI openclaw onboard. OpenHuman v0.53 — Tauri desktop, Memory Tree, блок [local_ai] в config.toml для Ollama/LM Studio. Оба стека на арендованном Mac Mini M4 (MACCOME) дают 24/7 uptime, unified memory для Q4-моделей и контроль данных на выделенном инстансе. Ниже: сравнение архитектур, спецификации RAM, SSH/VNC, установка LaunchAgent, выбор моделей Ollama, hardening, TCO. Детали Ollama: runbook; launchd: чеклист.
OpenClaw — channel-first agent platform: процесс Gateway слушает webhooks/long polling, маршрутизирует LLM-вызовы, исполняет tools. Состояние: ~/.openclaw/, workspace, AGENTS.md. OpenHuman — memory-tree-first desktop agent: ветвящийся контекст по проектам, локальный inference через Ollama endpoint. Параметры выбора: нужен внешний Bot 24/7 → OpenClaw; нужен постоянный desktop copilot с древовидной памятью → OpenHuman.
Co-hosting на одном M4: суммируйте RSS Gateway, Ollama model resident set и Memory Tree I/O. На 16 GB — один локальный 7B максимум; второй продукт через cloud API fallback. На 32 GB — разделение ролей без swap.
| Параметр | OpenClaw | OpenHuman v0.53 |
|---|---|---|
| Entry point | npm i -g openclaw, openclaw onboard |
install.sh, config.toml |
| Daemon | launchd Gateway | Tauri + background worker |
| Persistence | Session state, skills dir | Memory Tree nodes |
| RAM (min prod) | 16 GB (API) / 32 GB (local 7B) | 16 GB (7B Q4) / 32 GB (13B+) |
| Observability | openclaw doctor, gateway logs |
App logs, tree size metrics |
Bottleneck локального inference на Apple Silicon — unified memory bandwidth, не CPU GHz. M4 16 GB: один Q4 7B (qwen2.5:7b-instruct-q4_K_M, llama3:8b-instruct-q4_K_M). M4 Pro 64 GB: 32B quantized, multi-agent, опционально CI co-location (с мониторингом I/O). Neural Engine дополняет Metal path Ollama; ключевой выигрыш — отсутствие постоянного egress в US API.
Регион MACCOME: минимизируйте RTT до webhook endpoints (Telegram/Discord). RU/EU команды часто берут Frankfurt-adjacent или SG/HK в зависимости от аудитории. Цены: тарифы аренды; multi-region: гайд.
| SKU | RAM / SSD | Workload | Ollama example | Idle power |
|---|---|---|---|---|
| M4 base | 16 GB / 512 GB | Gateway+API или OpenHuman+7B | qwen2.5:7b-instruct-q4_K_M | ~4–6 W |
| M4 upgraded | 32 GB / 1 TB | Dual product, один local model | llama3:8b-instruct-q4_K_M | ~6–15 W |
| M4 Pro | 64 GB / 2 TB | 32B, multi-agent, CI sidecar | qwen2.5:32b-instruct-q4_K_M | ~10–25 W |
Provision через оформление заказа, auth по SSH key. GUI setup OpenHuman: VNC. Gateway admin port — только loopback + ssh -L 18789:127.0.0.1:18789 или Tailscale. Disable sleep: sudo pmset -a sleep 0 displaysleep 0. Checklist: zero trust, центр помощи.
Day-0 checklist: macOS + CLT, Homebrew node@24 + ollama, disk >100 GB free, NTP sync, dedicated macOS user (не shared account для prod onboard).
Node 24 pin → openclaw doctor → openclaw onboard (runbook). Register Ollama at http://127.0.0.1:11434/v1 as OpenAI-compatible. Complete ≥1 channel smoke test. openclaw onboard --install-daemon → verify post-reboot with openclaw gateway status.
./install.sh → edit config.toml:
[local_ai] base_url → Ollamamodel → pinned tagcontext_limit → match model windowMemory Tree root: persistent path under ~/.openhuman/. Pre-return: tar czf openhuman-backup-$(date +%Y%m%d).tar.gz ~/.openhuman/.
brew install ollama node@24 ollama serve & ollama pull qwen2.5:7b-instruct-q4_K_M npm i -g openclaw@latest openclaw doctor && openclaw onboard openclaw onboard --install-daemon chmod +x install.sh && ./install.sh ssh -L 18789:127.0.0.1:18789 user@rental-mac.example.com openclaw gateway status
Production defaults 2026: Qwen2.5 7B (RU/EN mix), Llama 3 8B (code), Gemma 3 4B (light always-on). OpenClaw routes to Ollama via OpenAI-compatible API — zero token opex loop. Quality ceiling ниже frontier cloud; retain API failover via multi-provider config.
Multi-agent resource rule: never load two 7B models concurrently on 16 GB — monitor memory_pressure, ollama ps. Security: CVE-2026-25253 hardening, firewall deny inbound gateway, mask tokens in logs, rotate webhooks on migration.
Data plane: local weights + session state on dedicated instance = reduced third-party inference exposure. Channel ingress still may contain PII — define retention + encrypted backup policy.
24-month horizon: purchase M4 16GB = capex + self-SLA + power; cloud GPU hourly = prohibitive for 24/7 agent idle+spike pattern; MACCOME rental = fixed OpEx, remote KVM, documented export. Break-even purchase typically >18 months if you value ops time.
Metrics week 1: gateway uptime, Ollama p95 latency, disk (models+logs+tree). OAuth triage: channel checklist. Export: центр помощи.
Zero token != zero cost: power, RAM, disk TBW, on-call human time remain. Rental bundles into predictable monthly line item.
| Model | 24 mo | 24/7 agent fit | Data control |
|---|---|---|---|
| Own M4 16GB | Capex + opex | Yes (self SLA) | High |
| MACCOME rental | Fixed (цены) | High | High (dedicated) |
| Linux VPS + API | Variable | Medium | Medium |
| Cloud GPU | High if always-on | Low | Low–medium |
Итог: OpenClaw и OpenHuman решают разные layer стека — channels vs desktop memory — но оба требуют always-on Apple Silicon. Аренда M4 переносит capex и datacenter duty на провайдера; вы фокусируетесь на skills, Memory Tree schema и runbooks. Intelligence ≈ f(uptime hours); hardware — интеграл этой функции.
FAQ
Одновременный запуск на одном Mac Mini?
Да с 32 GB RAM; на 16 GB один стек через API.
Зачем локальный inference на аренде?
Контроль данных на dedicated macOS. Цены аренды.
Почему не ноутбук?
Sleep убивает Gateway и Memory Tree. Аренда Mac.
Export перед возвратом?
tar ~/.openclaw/ + OpenHuman; rotate tokens. Центр помощи.