一台电脑,零成本,跑 Hermes Agent
昨晚我把 Ollama 装好,拉了一个 27B 的模型,启动 Hermes。

昨晚我把 Ollama 装好,拉了一个 27B 的模型,启动 Hermes。
整个过程没有注册任何账号,没有填任何信用卡,没有同意任何数据协议。
终端里跳出第一行回复的时候,我看了一眼系统监控。CPU 占用拉满,风扇转起来了。
除此之外,安静得像什么都没发生。
零成本是什么意思
不是免费试用三天。不是每月送你 5 美元额度。
是真的不花钱。
模型跑在你自己的机器上。推理用的是你的 CPU 或 GPU。唯一的成本是电费。没有 API 调用费,没有月订阅,没有速率限制。
用多少次都行。凌晨三点跑一百次也没人管你。
为什么 2026 年才行
两年前本地模型还是玩具。7B 的模型勉强能聊天,工具调用基本不可靠。
现在不一样了。
Gemma 4 在 HomeSec-Bench 上跑出 97.9% 的得分,匹配 GPT-5.4 的水平。一个 26B 的本地模型,和最强的云端模型打了个平手。
这个数字让我停了一下。
不是说本地模型「还行」「凑合用」。是真的够用了。
三个推荐模型

Qwen3.5 27B 是目前最稳的选择。工具调用的成功率高,Hermes 的 Agent 循环跑起来不容易断。16GB 内存的机器就能装下。
Gemma 4 用了 MoE 架构。总参数 26B,但每次推理只激活 4B。所以快。MacBook Pro M5 上实测 59.9 tok/s,接近实时对话的体感。
Hermes 4 是 Nous Research 自己微调的。35B 总参数,3B 活跃。RTX 4090 可以跑。128K 的上下文窗口,长对话不会丢失前文。
Hermes 不挑模型
这是关键。
Hermes Agent 是 model-agnostic 的。它不绑定 OpenAI,不绑定 Anthropic,不绑定任何一家。只要模型支持工具调用的格式,Hermes 就能用。
Ollama 提供了本地模型的运行环境。Hermes 通过标准接口和 Ollama 对话。
两者拼在一起,就是一个完全本地的 Agent 栈。
完全本地,数据不出门

数据不出你的机器。
你的代码、你的笔记、你的对话历史,全部留在本地磁盘上。没有任何一个字节发送到远端服务器。
对于处理敏感项目的人来说,这不是加分项,是必要条件。
限制是真实的
我不想把这件事说得太美好。
本地跑 27B 模型,需要 16GB 以上的 RAM。没有独显的老笔记本跑不动。
推理速度比云端慢。云端的 GPT-5.4 响应几乎是瞬时的,本地模型需要等几秒到十几秒。
复杂推理任务的质量,本地模型可能不如顶级云端模型。数学证明、多步逻辑链、超长代码生成,差距还在。
这些是事实。
混合策略
Hermes 支持 /model 命令随时切换模型。
简单任务走本地。文件整理、代码格式化、日常问答、重复性操作。这些不需要最强的模型,本地的 27B 绰绰有余。
复杂任务切云端。架构设计、长文写作、多步推理。这些场景值得花几分钱调用顶级模型。
一个命令就能切换。不需要重启,不需要重新配置。
这样算下来,一个月的 API 费用可能从几十美元降到几美元。大部分日常任务被本地消化了。
我在想什么
2026 年的临界点到了。
不是「本地模型终于能跑了」这种程度。是「本地模型跑出来的结果,和云端几乎一样好」这种程度。
一台普通电脑。一个开源的 Agent 框架。一个本地模型。
有记忆,会学习,零成本。
想了想,这件事最让我在意的不是省钱。是自主性。
你的 Agent 不依赖任何公司的服务器。不会因为某家公司调价而失效。不会因为某个 API 下线而中断。它就在你的机器上,随时可用。
这种感觉,像是真正拥有了一个工具。
不是租来的,是你的。
参考资料
- Nous Research - Hermes Agent[1]
- Ollama - 本地模型运行环境[2]
- Google - Gemma 4 Technical Report[3]
- Qwen - Qwen3.5 模型发布[4]
- HomeSec-Bench 评测结果[5]
Reference
[1]
Nous Research - Hermes Agent: https://github.com/NousResearch/hermes-agent
[2]
Ollama - 本地模型运行环境: https://ollama.com/
[3]
Google - Gemma 4 Technical Report: https://ai.google.dev/gemma
[4]
Qwen - Qwen3.5 模型发布: https://qwenlm.github.io/
[5]
HomeSec-Bench 评测结果: https://github.com/google-deepmind/gemma
下方是赋能君的AI学习交流永久免费星球,想学习更多内容,欢迎扫码加入。

🙌 如果你阅读到这里,说明我们对信息的认可区域是有一定交集的,可以说我们是同道中人,所以如果你有自认为不错的信息获取渠道,欢迎留言或者私聊我,谢谢。
都看到这里了,就给个关注吧👀:
喜欢我的文章,可以请你右下角顺手来一波点赞&在看&分享三连么👉
💬 本文评论区已开启,但暂无读者留言。
本文转载自微信公众号,如有侵权请联系删除。
- 标题: 一台电脑,零成本,跑 Hermes Agent
- 作者: lxiol
- 创建于 : 2026-05-06 10:58:21
- 更新于 : 2026-05-12 16:07:04
- 链接: https://blog.lxiol.cn/2026/05/06/一台电脑零成本跑-Hermes-Agent/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。