Hermes Agent 高级玩法:微信扫码即用 + LLM Wiki 知识库,打造你的数据飞轮
Andrej Karpathy 最近发了一条推文,16 小时内 1600 万次浏览。
Andrej Karpathy 最近发了一条推文,16 小时内 1600 万次浏览。他说自己不再用 LLM 写代码,而是用来建知识库。
核心思路很简单:传统 RAG 每次查询都要从头检索,没有积累。他让 LLM 维护一个持久 Wiki——新增内容自动编译进去,知识复利增长。
这条推文火了之后,Hermes Agent 立刻实现了这个工作流。今天讲两个高级功能:微信原生集成和LLM Wiki 知识库。
一、微信集成:扫码就能用
Hermes Agent 支持个人微信账号直连,用的是腾讯 iLink Bot API。不需要公网端点、不需要 Webhook,HTTP 长轮询就够。
设置流程(3 步)
Step 1:运行设置向导
1 | `hermes gateway setup` |
提示中选择 Weixin。向导自动完成:
- 请求二维码 → 显示在终端或提供 URL → 等你扫码 → 手机确认登录 → 保存凭证到
~/.hermes/weixin/accounts/
成功后看到:微信连接成功,account_id=your-account-id
Step 2:配置环境变量
QR 登录完成后,在 ~/.hermes/.env 设置:
1 | `WEIXIN_ACCOUNT_ID=your-account-id |
Step 3:启动网关
1 | `hermes gateway` |
适配器恢复凭证,连接 iLink API,开始长轮询接收消息。
支持的功能
- 私聊/群聊消息(可配置访问策略)
- 图片/视频/文件/语音媒体支持
- AES-128-ECB 加密 CDN 媒体传输
- Markdown 格式自动适配(标题/表格/代码块转微信可读)
- 智能消息分块(4000 字符以内单条发送)
- “对方正在输入…”提示
- 消息去重(5 分钟滑动窗口)
- 自动重试与退避
私聊策略:默认 open(任何人可私聊),可设 allowlist(白名单)、disabled(忽略私聊)、pairing(配对模式)。
群聊策略:默认 disabled(忽略群消息,因为个人微信可能在很多群)。
二、LLM Wiki:告别 RAG 的无状态检索
传统 RAG 的痛点:每次查询从头检索,没有积累。问一个需要综合五篇文档的问题,LLM 每次都要重新拼凑碎片。知识不沉淀。
Karpathy 的思路:让 LLM 维护一个持久 Wiki——新增内容自动编译进去,更新实体页、修订主题摘要、标注矛盾、强化或挑战已有观点。
Wiki 是持久、复利增长的 artifact。交叉引用已经建好、矛盾已标注、综合已反映所有阅读内容。每加一个来源、每问一个问题,Wiki 都更丰富。
三层架构
1 | `my-research/ |
Layer 1:Raw Sources(不可变)
你的原始文档集合——文章、论文、代码仓库、数据集、图片。LLM 只读,从不修改。这是验证基线:Wiki 里每条声明都能追溯到 raw/ 里的文件。
用 Obsidian Web Clipper 浏览器扩展可以把网页文章转成 markdown,直接丢进 raw/articles/。
Layer 2:The Wiki(LLM 生成)
Agent 生成的 markdown 页面,按类型组织:
concepts/
:概念页(如attention-mechanism.md)entities/
:实体页(如openai.md)sources/
:来源摘要(每个摄入文档一条)comparisons/
:对比页(如rag-vs-fine-tuning.md)
两个关键文件:
index.md
:内容目录,每次 ingest 更新,LLM 查询时先读这个导航log.md
:时间线日志,记录每个 ingest、每次更新、发现的矛盾
Layer 3:Schema(CLAUDE.md)
最重要的文件。定义 Wiki 结构、命名约定、页面模板、操作流程。它把通用 LLM 变成纪律严明的知识管理员。
三、三种核心操作
Karpathy 用编译器类比:raw/ 是源码,LLM 是编译器,wiki/ 是输出,lint 是测试,query 是运行时。
Ingest(摄入)
把新来源丢进 raw/,告诉 Agent 处理:
1 | `> I added a new article to raw/articles/. Please ingest it.` |
Agent 执行:
- 读取文档,讨论关键要点
- 在
wiki/sources/创建摘要页 - 级联更新 10-15 个相关 Wiki 页
- 如需创建新概念/实体页
- 更新
index.md - 向
log.md添加记录
单次 ingest 可能触碰几十个 Wiki 页,因为 Agent 要追踪知识图谱里的关联。
Query(查询)
向 Wiki 提问。Agent 搜索 index.md,读相关页面,综合回答并附 [[wiki-link]] 引用。
关键洞察:好的回答可以反向写入 Wiki。 你问的对比、分析、发现的连接——这些有价值,不应消失在聊天历史里。这样你的探索也像摄入来源一样复利增长。
Lint(健康检查)
定期让 Agent 检查 Wiki:
- 页面之间的矛盾
- 过时声明(新来源已覆盖)
- 孤页(没有入链)
- 重要概念被提及但缺独立页
- 缺失交叉引用
- 可用 web 搜索填补的数据缺口
Agent 擅长建议新问题和新来源。这让 Wiki 随增长保持健康。
四、RAG vs LLM Wiki:什么时候用哪个
维度
RAG
LLM Wiki
数据规模
数百万文档
100 文档,40 万字
架构复杂度
向量数据库 + embedding + chunking + rerank
纯 markdown + index.md
知识沉淀
无(每次从头检索)
有(编译后持续更新)
可审计性
黑盒向量,难以追溯
每条声明可追溯到 .md 文件
维护成本
需要专业 infra
Agent 自动维护
适用场景
企业级海量数据
个人/团队研究项目
Karpathy 的 Wiki 已长到约 100 篇文章、40 万字——比大多数博士论文还长——而他几乎没自己写过。
五、实战演示:从 ArXiv 论文到 Obsidian 图谱
视频演示了完整流程:
- 创建 Wiki
:hermes wiki init llm-finetuning - 批量摄入论文
:Agent 从 ArXiv 抓取微调相关论文 → 自动提取结构化知识 → 生成交叉引用 Wiki 页 - 研究命令
:研究防止过拟合的方法→ Agent 基于 Wiki 分析 → 生成新 Wiki 页面 - 多 Wiki 管理
:创建多个 Wiki 无缝切换 → 合并相关 Wiki(演示合并两个 Wiki 得到 27 页知识库) - Obsidian 可视化
:打开 Wiki 目录 → Graph 视图显示交叉引用网络 → 点击节点浏览页面
六、数据飞轮:知识复利增长
Karpathy 总结了核心价值:
“编译一次,持续更新。”
传统知识库死于维护成本。收集容易,整理困难,规模化维护不可能。
LLM Wiki 把这个不可能变成自动化:
- 你负责 curate(选什么进来)
- Agent 负责 bookkeeping(读、总结、交叉引用、更新索引、标注矛盾)
结果:知识库随时间复利增长,而不是随时间腐烂。
七、怎么开始
微信集成:
1 | `pip install aiohttp cryptography qrcode |
LLM Wiki:
1 | `hermes wiki init my-research |
Karpathy 的 Gist:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
Hermes Wiki 教程:https://www.aivi.fyi/llms/hermes-wiki
最后一句
RAG 是检索,LLM Wiki 是编译。检索每次从头来,编译一次后持续更新。如果你有个人研究项目、团队知识库、或者只是想给读完的书建个 companion wiki——这是目前最优雅的方案。
💬 本文评论区已开启,但暂无读者留言。
本文转载自微信公众号,如有侵权请联系删除。
- 标题: Hermes Agent 高级玩法:微信扫码即用 + LLM Wiki 知识库,打造你的数据飞轮
- 作者: lxiol
- 创建于 : 2026-04-27 20:21:25
- 更新于 : 2026-05-12 16:47:34
- 链接: https://blog.lxiol.cn/2026/04/27/Hermes-Agent-高级玩法微信扫码即用-LLM-Wiki-知识库打造你的数据飞轮/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。