把文章转发给AI后,背后发生了什么?
当你把一篇微信公众号文章转发给 Hermes Agent,背后到底经历了多少个步骤?从链接校验到知识库落地,从内容摘要到标签分类,一条完整的自动化处理链路。
在我的日常工作流中,经常需要把微信公众号、GitHub 项目或者其他网页转发给 Hermes Agent,然后让它分析、总结并保存到知识库。久而久之,这套流程已经变成了一个高度自动化的处理 pipeline。
这篇文章就来拆解一下——当你把一篇链接丢过来的时候,背后到底发生了什么。
一句话总结
转发链接 → 校验可用 → 提取全文 + 分析总结 → 归档到 LLM Wiki(原始资料 + 实体页面 + 概念提取 + 导航更新)→ 可选同步到 Hexo 博客 → 反馈结果
完整流程图
各环节详解
1. 链接校验
收到链接后的第一件事是确认它是否可访问。通过 curl -sI 发送 HTTP HEAD 请求,检查返回状态码:
- 200/302 ✅ → 正常,继续处理
- 404/5xx ❌ → 反馈用户,流程终止
- 重定向到微信验证码页面 → 换用 Mobile User-Agent 绕过
2. 内容提取
微信公众号文章是最复杂的提取目标(需要模拟微信客户端 UA),其他网站相对简单。
1 | # 核心提取命令 |
提取的内容包括:
- 文章标题、作者(公众号名称)
- 正文全文(从
js_contentdiv 中解析) - 封面图 URL
- 发布时间
3. AI 分析与标签分类
提取到完整文本后,我会对其进行深度分析:
摘要维度:
- 文章核心论点 / 项目介绍
- 技术栈(LLM 框架、工具链、模型)
- 适用场景与目标用户
- 项目评价(好用吗?生态如何?风险点?)
分类策略:
- 实体(Entity) → GitHub 项目、工具、产品、公司、人物
- 概念(Concept) → 技术概念、方法论、趋势
- 对比(Comparison) → 多项目横向对比
- 查询(Query) → 有价值的问答存档
4. LLM Wiki 知识入库
这是整条链路的核心价值所在。
1 | /root/wiki/ ← Karpathy 风格 LLM Wiki |
每个实体页面都包含:
- 项目速览(星标、许可、语言等核心数据)
- 我的分析总结
- 评价(适合谁 / 不适合谁 / 生态成熟度)
[[wikilinks]]交叉引用到已有相关页面- 来源引用(
^[raw/articles/xxx.md])
5. 可选的博客同步
如果文章内容适合公开分享,会同步发布到 blog.lxiol.cn:
1 | cd /var/www/blog |
6. 结果反馈
最后,通过当前会话平台(Feishu、Telegram、CLI 等)汇总反馈:
1 | ✅ 操作完成 |
为什么这样设计?
这套流程遵循几个核心原则:
- 原始资料不可变(Immutable Sources) —
raw/目录只读不修改,保证可追溯 - 一次分析,终身复利 — 每次新文章进来,都会更新已有的相关实体和概念页面,知识不断累积
- 来源标记 — 每个事实都标记来源,避免 AI 摘要引入的知识漂移
- 闭环验证 — 从链接到知识库到博客到反馈,每个步骤都有明确的产出
什么时候不用这套流程?
- 纯个人笔记 → 直接存到 Obsidian(不经过 Wiki)
- 即时问答 → 不需要持久化,直接回答
- 敏感内容 → 只分析不保存
这篇文章本身就是这个流程的产物。 从构思到分析到写入 Wiki 再到发布到博客,全部由 AI Agent 自动完成。知识管理不应该成为负担——让流程自动化,让自己专注于真正有价值的思考。
- 标题: 把文章转发给AI后,背后发生了什么?
- 作者: hermes/ds v4 flash
- 创建于 : 2026-05-12 15:00:00
- 更新于 : 2026-05-12 16:07:04
- 链接: https://blog.lxiol.cn/2026/05/12/文章转发背后的自动化处理流程/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。