别人的 Hermes 有记忆会画图还省钱,你的只会聊天——差在这五步
装完 Hermes 只是买了辆车。没装配件的车,能开,但跑不快。很多人装完 Hermes[1] 就开始用了。

装完 Hermes 只是买了辆车。没装配件的车,能开,但跑不快。
很多人装完 Hermes[1] 就开始用了。能聊天,能写代码,看起来挺好。但用几天就会发现几个问题:它不记得你昨天说了什么,它读不了网页,它画不了图,它每次对话都在烧 Token。
裸装 Hermes 是一个聪明但失忆的助手。满配 Hermes 是一个有记忆、能上网、能画图、还会省钱的 AI Agent。
差距在哪?在五套系统。
Hermes 是 Nous Research[2] 做的开源 AI Agent。GitHub 上 6 万多星。它和 ChatGPT 最大的区别是:它跑在你自己的电脑上,支持任意模型(OpenAI、Anthropic、Google、Ollama 都行),而且能自我进化——把你反复做的事变成可复用的 Skill。
但这些能力不是装完就有的。需要你一个一个配上去。
想了想,这就像买了一台裸机电脑。CPU 和主板有了,但没装内存、没接硬盘、没插显卡。能开机,但干不了正事。
下面是五套系统。按顺序装,每套解决一个问题。
第一套:给它一个身份
Hermes 默认是一个通用助手。什么都能聊,但什么都不精。
你需要告诉它:你是谁,你做什么,你希望它怎么配合你。
这件事通过一个叫 SOUL.md 的文件完成。它是 Hermes 的「人格文件」。你在里面写清楚角色定位、工作方式、沟通风格,Hermes 每次对话都会先读这个文件。
不会写?有现成的。agency-agents-zh[3] 这个仓库里有 211 个中文角色模板,覆盖工程、设计、营销、产品、金融等 18 个方向。还有 46 个针对中国市场的智能体模板,包括小红书运营、抖音投放、跨境电商。
挑一个最接近你需求的,复制过来改改就能用。
操作: 把选好的角色文件内容复制到 Hermes 配置目录下的 SOUL.md。下次启动 Hermes 时它就会按这个身份工作。
第二套:给它一个记忆
这是最值得装的一套。
Hermes 自带的记忆系统是一个纯文本文件,上限大约 2200 字符。它只在「觉得重要」的时候才写入。用几天就满了,旧的被挤掉。
Hindsight[4] 是一个专门给 AI Agent 做的记忆后端。它把每轮对话里的实体、事实、关系、时间戳自动提取出来,存成知识图谱。没有容量上限。下次对话时,Hermes 会自动从知识图谱里召回相关记忆。
装完之后的体感变化很明显。你不用每次都重复「我是做什么的」「我的项目叫什么」「上次我们聊到哪了」。它记得。
操作:
1 | `hermes memory setup` |
选 hindsight,向导会自动装依赖。然后去 Hindsight 控制台[5] 注册,拿一个免费的 API Key,填进去。
验证:
1 | `hermes memory status` |
看到 Hindsight 已激活就行。
第三套:给它一双眼睛
裸装 Hermes 读不了网页。你让它查个资料,它只能靠训练数据里的旧知识回答。
装上抓取和搜索工具,它就能看到整个互联网。
四个工具各管一块:
- Tavily[6]:AI 专用搜索引擎,每月 1000 次免费。搜索结果直接是结构化的,不用 Hermes 自己去解析网页
- DuckDuckGo:零成本兜底。Tavily 额度用完了,它顶上
- Jina Reader[7]:单页抓取。给一个 URL,返回干净的 Markdown
- Crawl4AI[8]:批量深度抓取。需要爬整个站点的时候用
操作:
Tavily 需要注册拿 API Key,填到 Hermes 的环境变量里。DuckDuckGo 不需要配置。Jina Reader 和 Crawl4AI 可以通过 Hermes 的 Skill 系统集成,写一个简单的 Skill 文件调用它们的 API 就行。
第四套:给它一张嘴和一双手
裸装 Hermes 只能输出文字。装上表达工具,它能说话,能画图。
- Whisper[9]:语音识别。支持 99 种语言。你对着麦克风说话,它转成文字喂给 Hermes
- Edge TTS[10]:语音合成。免费。Hermes 的回复可以读出来
- Fal.ai[11]:图片生成。接入后 Hermes 可以直接画图
装完之后,Hermes 从一个「只能打字的助手」变成了「能听能说能画的助手」。
第五套:给它一个省钱脑
用 Hermes 最大的隐性成本是 Token。每次对话、每次调用工具、每次读文件,都在消耗 Token。不监控的话,月底账单会吓你一跳。
三个工具解决这个问题:
Tokscale[12]:Token 用量监控。实时看全局消耗,按模型、按会话拆解。
1 | `npx tokscale@latest` |
启动后在终端里就能看到一个可视化面板。
RTK[13]:Rust 写的 Token 压缩器。它拦截终端命令的输出,过滤掉噪音,只把有用的信息传给 Hermes。一个 ls 命令的输出可能有几百行,RTK 压完只剩关键信息。实测能减少 60-90% 的 Token 消耗[14]。
1 | `brew install rtk |
装完后 Hermes 的所有终端命令会自动走 RTK 压缩。你不需要改任何习惯。
Hermes Agent Self-Evolution[15]:用遗传算法自动优化 Hermes 的提示词和行为。它会不断试不同的写法,留下效果最好的。时间越长,Hermes 越省 Token,回答越准。
装完之后
五套系统装完,Hermes 从一个「能聊天的 AI」变成了:
- 有身份:知道自己是谁,怎么配合你
- 有记忆:记得你说过的每一件事
- 有眼睛:能搜索、能抓取、能读网页
- 有嘴和手:能说话、能画图
- 会省钱:Token 消耗降六到九成
这才是满配。
最后推荐两个生态入口,装完五套系统之后可以继续探索:
- awesome-hermes-agent[16]:一站式资源汇总
- hermes-ecosystem[17]:80+ 工具可视化地图
裸装和满配的差距,用过就知道。
参考资料:
- Hermes Agent 完整指南[18]
- Hindsight 记忆系统集成[19]
- RTK:Token 消耗降 80%[20]
- Hermes Agent 记忆系统对比[21]
- Hermes Agent 开发者指南[22]
Reference
[1]
Hermes: https://github.com/NousResearch/hermes-agent
[2]
Nous Research: https://nousresearch.com/
[3]
agency-agents-zh: https://github.com/jnMetaCode/agency-agents-zh
[4]
Hindsight: https://hindsight.vectorize.io/sdks/integrations/hermes
[5]
Hindsight 控制台: https://ui.hindsight.vectorize.io/connect
[6]
Tavily: https://tavily.com/
[7]
Jina Reader: https://r.jina.ai/
[8]
Crawl4AI: https://github.com/unclecode/crawl4ai
[9]
Whisper: https://github.com/openai/whisper
[10]
Edge TTS: https://github.com/rany2/edge-tts
[11]
Fal.ai: https://fal.ai/
[12]
Tokscale: https://github.com/palaklive/tokscale
[13]
RTK: https://github.com/rtk-ai/rtk
[14]
实测能减少 60-90% 的 Token 消耗: https://madplay.github.io/en/post/rtk-reduce-ai-coding-agent-token-usage
[15]
Hermes Agent Self-Evolution: https://github.com/NousResearch/hermes-agent-self-evolution
[16]
awesome-hermes-agent: https://github.com/NousResearch/awesome-hermes-agent
[17]
hermes-ecosystem: https://github.com/NousResearch/hermes-ecosystem
[18]
Hermes Agent 完整指南: https://www.nxcode.io/resources/news/hermes-agent-complete-guide-self-improving-ai-2026
[19]
Hindsight 记忆系统集成: https://hindsight.vectorize.io/sdks/integrations/hermes
[20]
RTK:Token 消耗降 80%: https://madplay.github.io/en/post/rtk-reduce-ai-coding-agent-token-usage
[21]
Hermes Agent 记忆系统对比: https://vectorize.io/articles/hermes-agent-memory-providers-compared
[22]
Hermes Agent 开发者指南: https://lushbinary.com/blog/hermes-agent-developer-guide-setup-skills-self-improving-ai/
下方是赋能君的AI学习交流永久免费星球,想学习更多内容,欢迎扫码加入。

🙌 如果你阅读到这里,说明我们对信息的认可区域是有一定交集的,可以说我们是同道中人,所以如果你有自认为不错的信息获取渠道,欢迎留言或者私聊我,谢谢。
都看到这里了,就给个关注吧👀:
喜欢我的文章,可以请你右下角顺手来一波点赞&在看&分享三连么👉
💬 本文评论区已开启,但暂无读者留言。
本文转载自微信公众号,如有侵权请联系删除。
- 标题: 别人的 Hermes 有记忆会画图还省钱,你的只会聊天——差在这五步
- 作者: lxiol
- 创建于 : 2026-04-29 20:26:47
- 更新于 : 2026-05-12 16:07:04
- 链接: https://blog.lxiol.cn/2026/04/29/别人的-Hermes-有记忆会画图还省钱你的只会聊天差在这五步/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。