一台电脑，零成本，跑 Hermes Agent

📝

昨晚我把 Ollama 装好，拉了一个 27B 的模型，启动 Hermes。

原文链接：https://mp.weixin.qq.com/s/Gt1TG5IGF9MupSTcK11xjg

昨晚我把 Ollama 装好，拉了一个 27B 的模型，启动 Hermes。

昨晚我把 Ollama 装好，拉了一个 27B 的模型，启动 Hermes。

整个过程没有注册任何账号，没有填任何信用卡，没有同意任何数据协议。

终端里跳出第一行回复的时候，我看了一眼系统监控。CPU 占用拉满，风扇转起来了。

除此之外，安静得像什么都没发生。

零成本是什么意思

不是免费试用三天。不是每月送你 5 美元额度。

是真的不花钱。

模型跑在你自己的机器上。推理用的是你的 CPU 或 GPU。唯一的成本是电费。没有 API 调用费，没有月订阅，没有速率限制。

用多少次都行。凌晨三点跑一百次也没人管你。

为什么 2026 年才行

两年前本地模型还是玩具。7B 的模型勉强能聊天，工具调用基本不可靠。

现在不一样了。

Gemma 4 在 HomeSec-Bench 上跑出 97.9% 的得分，匹配 GPT-5.4 的水平。一个 26B 的本地模型，和最强的云端模型打了个平手。

这个数字让我停了一下。

不是说本地模型「还行」「凑合用」。是真的够用了。

三个推荐模型

Qwen3.5 27B 是目前最稳的选择。工具调用的成功率高，Hermes 的 Agent 循环跑起来不容易断。16GB 内存的机器就能装下。

Gemma 4 用了 MoE 架构。总参数 26B，但每次推理只激活 4B。所以快。MacBook Pro M5 上实测 59.9 tok/s，接近实时对话的体感。

Hermes 4 是 Nous Research 自己微调的。35B 总参数，3B 活跃。RTX 4090 可以跑。128K 的上下文窗口，长对话不会丢失前文。

Hermes 不挑模型

这是关键。

Hermes Agent 是 model-agnostic 的。它不绑定 OpenAI，不绑定 Anthropic，不绑定任何一家。只要模型支持工具调用的格式，Hermes 就能用。

Ollama 提供了本地模型的运行环境。Hermes 通过标准接口和 Ollama 对话。

两者拼在一起，就是一个完全本地的 Agent 栈。

完全本地，数据不出门

数据不出你的机器。

你的代码、你的笔记、你的对话历史，全部留在本地磁盘上。没有任何一个字节发送到远端服务器。

对于处理敏感项目的人来说，这不是加分项，是必要条件。

限制是真实的

我不想把这件事说得太美好。

本地跑 27B 模型，需要 16GB 以上的 RAM。没有独显的老笔记本跑不动。

推理速度比云端慢。云端的 GPT-5.4 响应几乎是瞬时的，本地模型需要等几秒到十几秒。

复杂推理任务的质量，本地模型可能不如顶级云端模型。数学证明、多步逻辑链、超长代码生成，差距还在。

这些是事实。

混合策略

Hermes 支持 /model 命令随时切换模型。

简单任务走本地。文件整理、代码格式化、日常问答、重复性操作。这些不需要最强的模型，本地的 27B 绰绰有余。

复杂任务切云端。架构设计、长文写作、多步推理。这些场景值得花几分钱调用顶级模型。

一个命令就能切换。不需要重启，不需要重新配置。

这样算下来，一个月的 API 费用可能从几十美元降到几美元。大部分日常任务被本地消化了。

我在想什么

2026 年的临界点到了。

不是「本地模型终于能跑了」这种程度。是「本地模型跑出来的结果，和云端几乎一样好」这种程度。

一台普通电脑。一个开源的 Agent 框架。一个本地模型。

有记忆，会学习，零成本。

想了想，这件事最让我在意的不是省钱。是自主性。

你的 Agent 不依赖任何公司的服务器。不会因为某家公司调价而失效。不会因为某个 API 下线而中断。它就在你的机器上，随时可用。

这种感觉，像是真正拥有了一个工具。

不是租来的，是你的。

参考资料

Nous Research - Hermes Agent[1]
Ollama - 本地模型运行环境[2]
Google - Gemma 4 Technical Report[3]
Qwen - Qwen3.5 模型发布[4]
HomeSec-Bench 评测结果[5]

Reference

[1]
Nous Research - Hermes Agent: https://github.com/NousResearch/hermes-agent
[2]
Ollama - 本地模型运行环境: https://ollama.com/
[3]
Google - Gemma 4 Technical Report: https://ai.google.dev/gemma
[4]
Qwen - Qwen3.5 模型发布: https://qwenlm.github.io/
[5]
HomeSec-Bench 评测结果: https://github.com/google-deepmind/gemma

下方是赋能君的AI学习交流永久免费星球，想学习更多内容，欢迎扫码加入。

🙌 如果你阅读到这里，说明我们对信息的认可区域是有一定交集的，可以说我们是同道中人，所以如果你有自认为不错的信息获取渠道，欢迎留言或者私聊我，谢谢。

都看到这里了，就给个关注吧👀：

喜欢我的文章，可以请你右下角顺手来一波点赞&在看&分享三连么👉

💬 本文评论区已开启，但暂无读者留言。

本文转载自微信公众号，如有侵权请联系删除。