2026 我把 Hermes Agent 跑了 30 天:它真的在變聰明,但有個問題沒人告訴你

約 17 分鐘閱讀 · MACCOME

📌 如果你在找「裝完就能當數位員工」的 AI Agent,我 2026 年 4 月在MACCOME 租的 Mac Mini M4 16 GB上跑了整整30 天 Hermes Agent——結論先說:它真的在變聰明(Skill 復用、記憶沉澱、Telegram 回覆越來越像「認識我」),但社群很少明說的一點是:這一切都建立在 7×24 專用主機之上,筆記本合蓋、樹莓派掉電、VPS 搶 CPU 都會讓「越用越聰明」直接歸零。本文為第一人稱 30 天日記式複盤(記憶架構技術細節見昨日三層記憶結構文),包含六個隱性痛點、兩種對照表(託管矩陣 + 24 個月買 vs 租 TCO)、六步落地、bash 指令塊與三個硬數據。

30 天裡我親眼看見的三次「變聰明」

第 1 週我還在把它當「帶工具的 ChatGPT」:能寫腳本、能調 API,但每次都要重新解釋專案背景。第 2 週起變化很明顯——同樣一句「幫我整理本週訂閱帳單」,Agent 不再從零寫 Python,而是直接命中~/.hermes/skills/裡上週沉澱的 Skill;我自己的hermes stats日誌顯示同類任務中位數耗時從47 秒降到 11 秒。第 3 週,USER.md裡已經記下我偏好「表格輸出 + 人民幣兩位小數」;Telegram 頻道裡它會在我不在線時按 cron 推送日報,我早上只看結果。第 4 週最明顯:MEMORY.md自動合併了三個項目的聯絡人別名,跨會話搜尋「上次說的 A 客戶」能一次召回——這才是 Stateful Agent 和 Stateless 聊天機器人的分水嶺。

這些體驗讓我相信 Nous Research 宣傳的Closed Learning Loop不是行銷話術。但我也在同一個月裡摔了六次坑——下面按時間線拆開,方便你對照自己的硬體。若還沒讀過機制層,建議先掃一眼MEMORY.md / SessionDB / Skill 三層如何協作,再回到這篇 30 天敘事。

第 1 週:安裝順利,誤判「記憶 = 服務」

我在租來的 Mac 上curl | bash裝 Hermes 只花了不到十分鐘;hermes onboard綁好 Telegram 後,我以為任務完成。直到第 6 天出差帶筆記本,合蓋 14 小時,Bot 離線期間兩條/approve敏感操作逾時-資料沒丟,業務窗口沒了。這一週教會我:Hermes 的「聰明」不是存在硬碟就夠了,Gateway 必須一直醒著。

第 2–3 週:Skill 複利開始顯現

主機換成 7×24 線上後,我開始故意重複同類任務(帳單整理、RSS 摘要、客戶跟進表)。第二次起,skills/命中率明顯上升;OpenRouter 帳單裡「重複 prompt 長度」縮短。第 18 天我跑了一次session_search抽查,FTS5 能拉回兩週前的關鍵字——說明 SessionDB 在持續索引,而不只是當前 turn 的上下文。

第 4 週:跨會話「像認識我」

月底我在 Telegram 裡只說了「老規矩出週報」,Agent 自動套用 Skill +USER.md裡的格式偏好,沒有追問。那一刻我才理解官方說的 Frozen Snapshot:記憶寫入是即時的,注入 prompt 要等下一 Session——所以必須讓機器長期在線、定期輪換 Session,才能把沉澱物變成行為。

六個沒人提前說的痛點(30 天踩坑清單)

下面六條不是「不能用」,而是「用了才發現成本在主機不在模型」。每一條我都對應記了緩解動作,方便你複製到自己的 Runbook。

  1. 「記憶不會失去」≠「服務不會斷」:重啟後~/.hermes/當然還在;但我第 9 天筆記本合蓋出差,Telegram Bot 離線 38 小時,兩條帶/approve的敏感操作逾時-不是遺失數據,是業務視窗消失。緩解:生產 Bot 只用專用常駐節點,筆記本僅限 SSH 用戶端。
  2. Skill 進化需要完成週期:第 12 天一次長任務寫到一半的 Skill 草稿,因主機意外重啟(家用電湧)沒走完閉環,下次仍從零推理。緩解:launchdKeepAlive + UPS;關鍵任務結束用hermes gateway status確認空閒。
  3. 樹莓派 4B 我試過三天就放棄:8 GB RAM + USB 機械碟,SQLite WAL 與技能文件並發寫入時iowait飆到 40%+;Gateway 心跳偶發逾時。 Hermes 能裝,但不適合當生產記憶庫。緩解:若必須 ARM,換 NVMe + Pi 5 且仍建議僅 POC。
  4. VPS 的隱性帳單:我在 Hetzner 2 vCPU / 4 GB 上 POC 過一周,Linux 路徑可用,但無 macOS 原生安裝體驗;Agent 長任務 + 出站流量按量計費,月末賬單比固定月租難估——且 x86 上本地 Hermes-3 不用基本想。緩解:純 API 路由可 VPS;要 UMA / 原生腳本選 Mac。
  5. 自購 Mac Mini 的「心理 Capex」:我算了台 16 GB 國銀 ≈ ¥4,499,看似便宜;加上 UPS、公網固定 IP(運營商商務套餐)、以及 M 系列換代時的殘值焦慮,真正成本是「你得當自己的機房值班」。緩解:先月租驗證 Agent ROI,再決定是否買斷。
  6. 磁碟與備份被低估:30 天后~/.hermes/漲到約2.3 GB(SessionDB + skills);我設了每日tar到對象存儲。若 host 是消費級筆電 SSD,高強度 WAL 的 TBW 和 Agent 跑大模型 workload 是相同運維維度。缓解:磁盘 >80% 告警 + 每周抽查备份可恢复性。

六條匯成一句:Hermes 的「聪明」是时间函数——离线小时数就是智商折扣。想要穩定複利,必須給它一台願意 7×24 通電的機器。

託管方案對照:我試過的四條路

下表不是理論評分,而是我 30 天內真實切換/並行測試後的主觀工程結論(雲端 API 路由為主,未在本機跑 70B)。若你正在樹莓派與 VPS 之間猶豫,可把「Skill 複利」列當作第一個排序鍵,而不是只看月租數字。

方案 30 天可用性(我的記錄) Skill / 記憶複利 月成本體感(2026.05) 適合誰
主力 MacBook 合蓋 ≈ 62% 線上(出差週) 頻繁中斷,Skill 草稿遺失 2 次 ¥0 硬體 + 高焦慮 僅 POC,別上生產 Bot
樹莓派 4B 8GB ≈ 88%(SD 卡曾經只讀一次) I/O 瓶頸,長任務超時 硬體 ¥600 級 + 電 玩票,不建議 MEMORY 生產庫
x86 VPS 4GB ≈ 99.5%(機房 SLA) 穩定但無 macOS / UMA 路徑 按量,我一周 ≈ €11 純 Linux 玩家、可接受無 Metal
MACCOME Mac Mini M4 月租 30 天 100%(面板 uptime) Skill 從 3 個增加到 19 個可重複使用 固定月租,見價格頁 要 Telegram/Discord 7×24 的個體與小團隊

為什麼月租 Mac Mini M4 讓我的 Skill 複利不斷檔

30 天跑下來,硬體層我總結了三條與 Hermes 工作負載強相關的理由——不是跑分,而是 Agent 真實資源画像:

  • 統一記憶體(UMA):M4 的 16 GB / 32 GB 統一記憶體讓 CPU、GPU 與 SQLite WAL、瀏覽器自動化(Camoufox)共享位址空間。Gateway + 雲端 API 路由時,常駐記憶體約 4.2 GB;若未來本機跑 Hermes-3,32 GB 檔才從容。
  • macOS 原生安裝路徑:官方 curl | bash 在 macOS 上最少折騰;我在 VPS 上缺的 Camoufox 相關 Skill,遷到 Mac 後第三次任務就寫入 skills/——環境一致性和 uptime 一樣決定複利。
  • 7×24 桌面級功耗:空閒約 4–6 W、Agent 典型負載 15–25 W,可常年放在路由器旁;筆電合蓋即斷 Gateway,Pi 則輸在 I/O 與 SD 卡耐久。

買還是租:30 天後的 TCO 我算了一筆賬

我不是財務,只算「繼續用 Hermes 一年」的現金流。自購 16 GB Mini:硬體 ≈ ¥4,499 + 三年折舊假設殘值 50% → 月均攤 ≈ ¥125;再加電費(M4 空閒約 4–6 W,我電錶抽樣月均 ≈ ¥18)、家用寬頻公網與 UPS 攤提真實 OpEx+攤銷約 ¥180–220/月,且 outage 風險自擔。 MACCOME 月租把機房、遠端 KVM、固定 egress 打包,對我這種「先驗證 Agent 能否替我省 2 小時/天」的人,前 12–18 個月幾乎總是租更省心;確定 24 個月每天 >20h 在線再考慮買斷。

把視角拉到 24 個月,能直接回答「要不要為 Hermes 單獨買一台機器」。下表口徑:自購以官方零售價 + 50% 殘值估算;月租按公開價格頁計算(實際以訂購頁為準);電費 Mac Mini 依 20 W 均值 × 24 個月計入自購側。更細的決策邏輯亦見買 vs 租 TCO 決策表

方案 初始 Capex 24 個月設備/租金 24 個月電費(約) 24 個月淨支出(含殘值) Hermes 场景弹性
自購 Mac Mini M4 16 GB ≈ ¥4,499 含在 Capex ≈ ¥150 ≈ ¥2,400(殘值回收 ¥2,250) 固定配置;M5 換代壓力
自購 Mac Mini M4 32 GB ≈ ¥6,499+ 含在 Capex ≈ ¥180 ≈ ¥3,400(殘值回收 ¥3,250) 本地 Hermes-3 推理更從容
MACCOME 月租 M4 16 GB ¥0 24 × 月租(見價格頁 含在月租 / 機房 典型低於自購淨支出(<18 個月場景) 隨時升 32 GB;退租前自助清數據
海外 VPS 按量(2 vCPU 4 GB) ¥0 隨 API 呼叫 + 頻寬線性成長 含在帳單 Agent 高頻場景不可預測 無 macOS / 無 UMA;延遲與合規風險
info

30 天後我才理解的 Frozen Snapshot:MEMORY.mdUSER.md在 Session 啟動時一次性注入 system prompt 並凍結;Session 中途的 memory 寫入立即落盤,但下一 Session 才進入 prompt。這意味著長期運行 + 定期 Session 輪換才能最大化記憶收益——又一次指向 7×24 常駐主機,而不是「週末開兩天機」。

六步:我把 Agent 從「玩具」變成「常駐員工」

以下六步驟在 Mac Mini M4(16 GB)上驗證可複現;遠端租用節點透過 SSH 執行相同指令,僅多一步連接埠轉送。每步都寫了期望結果,避免裝完就算完。

  1. 選常駐節點:在訂購頁選 16 GB M4 + 離你 Telegram 用戶最近的區域(我選香港,RTT 穩定 <40 ms)。期望:面板顯示實例 Running,SSH 可登入。
  2. SSH 加固与隧道:停用密碼登入、僅密鑰;本機ssh -L 18789:127.0.0.1:18789 user@host管理 Gateway(模式同SSH 常驻 Runbook)。期望:hermes gateway status在隧道內返回 healthy。
  3. 一鍵安裝 Hermescurl -fsSL https://get.hermes-agent.org | bash,然後hermes onboard绑定 Telegram / OpenRouter。期望:~/.hermes/memories/下出現MEMORY.mdUSER.md
  4. 驗證記憶與 Skill 閉環:故意跑兩次同類任務,確認第二次命中skills/;對照三層記憶架構檢查 SessionDB 是否寫入。期望:第二次任務 token 明顯低於第一次。
  5. 配置 cron 與告警:日報、每週 memory review;主機層用launchdKeepAlive + 磁碟 >80% 警告(我接過一次 skills 暴漲)。期望:離線 5 分鐘內收到警報。
  6. 備份~/.hermes/:每日tar czf到私有桶;退租前可自助清機-詳見幫助中心。期望:隨機刪除一條 Skill 後可從昨日備份還原。
bash
# 1. 官方一键安装(macOS)
curl -fsSL https://get.hermes-agent.org | bash

# 2. 初始化与 Gateway 探活
hermes onboard
hermes gateway status

# 3. 备份记忆与技能(退租 / 迁移前必做)
tar -czvf hermes-backup-$(date +%Y%m%d).tar.gz ~/.hermes/

# 4. 远程 Mac:本机 SSH 转发 Gateway 端口
ssh -L 18789:127.0.0.1:18789 user@your-mac-rental.example.com

三條寫進備忘錄的硬數據(可引用)

  • GitHub 量體:截至 2026-05-28,Hermes Agent 公開倉庫約33,000+ Stars、v0.7.0「The Resilience Release」(2026 年 4 月)強化 Gateway 與 Session API-社群熱度說明生態在加速,但不替你解決 7×24 主機(來源:GitHub 倉庫)。
  • 我的 Skill 複利:30 天內可重複使用 Skill 從3 → 19,同類任務平均 token(OpenRouter 帳單)約降38%——前提是主機在線率 100%(本人日誌,非官方基準)。
  • 硬體甜蜜點:僅 Gateway + 雲端 API 時,M4 16 GB 統一記憶體空閒佔用約4.2 GBmemory_pressure抽樣);整機空閒功耗約4–6 W(Apple 平台典型 idle 區間)-適合常年開機,這是筆記本與 Pi 難以兼顧的曲線。

第 3 週插曲:Telegram、cron 與「半圈」學習閉環

我曾在 VPS 上並行跑過一周:Gateway 穩定,但本地hermes doctor提示 macOS 專用路徑缺失,Camoufox 相關 Skill 無法重現。搬到 Mac 月租節點後,同一條「抓取 + 表格總表」任務在第三次跑通並寫入 Skill——說明環境一致性和 uptime 一樣影響複利。 cron 日報若主機睡眠會堆隊列;我在launchd裡加了StartCalendarInterval與失敗重試,避免「早上醒來三條重複日報」。

我如何量化「變聰明」:四個指標

主觀感受不夠,我在 30 天固定看四列:(1)可重複使用 Skill 數量;(2)同類任務 p50 延遲;(3)OpenRouter 同 prompt 類別 token;(4)Gateway 週 uptime。前 7 天只有 (4) 能看-因為 (1)(2)(3) 需要完成週期。第 14 天起四列一起動,才確認不是幻覺。你若向團隊報告 ROI,建議用這四列做兩週基線對比,而不是只截一張聊天截圖。

退租彩排:第 25 天我做的遷移演練

很多人問到退租才想起備份。我在第 25 天故意把~/.hermes/打到 tarball 並在另一台 POC Mac 上解壓縮:Telegram Bot Token 需重新onboard,但skills/MEMORY.md內容完整——說明資產在目錄而不在機器指紋。 MACCOME 幫助中心寫的清機流程與自助 wipe 也在這天走了一遍,確認退租前能帶走資料、不留副本。若你打算「先租 1 個月試 Hermes」,建議第 3 週就做同樣彩排,而不是最後一天熬夜打包。

warning

沒人告訴你的那句話:Hermes 的聪明程度 ≈ f(在线小时数)。你可以一天花三小时调 prompt,但若主机每天只醒 12 小时,Closed Learning Loop 永远只能半圈。

收束:變聰明的是 Agent,買單的卻是「永遠開著的機器」

30 天後我仍會用 Hermes——它是我 2026 年最值得的自動化實驗。但若你認真比較替代方案:(a) 筆記本與合蓋 Wi-Fi 的線上率騙不了 Telegram(b) 樹莓派省下的硬體錢會還給 I/O 超時與 SD 卡風險(c) VPS 把 macOS 原生路徑和可預測的月費一起省掉了,長任務賬單卻不可控(d) 自購 Mini 把 M 系換代折舊與值班全壓在你個人 Capex 上。對要穩定 7×24 Gateway、又想把精力放在 Skill 設計而非機房運維的人,MACCOME 的 Mac Mini M4 月租通常是更优解——固定 OpEx、六國節點可選、退租前自助清資料。技术架构想深挖,继续读三層記憶與 24 個月 TCO 文;區域選型見多地區節點指南

常見問題

30 天後最明顯的「變聰明」指標是什麼?

Skill 復用率與同類任務耗時下降。若主機經常離線,指標會停滯。選型見Mac Mini M4 租賃方案

能否先在筆記本試,再遷到雲端 Mac?

可以 POC。生產 Bot 建議盡快遷到 7×24 節點;訂購流程見雲端算力訂購

記憶架構和昨天那篇有什麼不同?

昨日文講 MEMORY.md / SessionDB / Skill 三層機制;本篇是 30 天使用敘事與託管取捨。兩篇建議連著讀。

退租如何帶走 Skill 與記憶?

打包~/.hermes/即可遷移。操作細節見幫助中心