Hermes Agent 中文指南发布,16 册 30 万字

lxiol
📝
/images/Hermes-Agent-中文指南发布16-册-30-万字/c635dbb296d4。png AI Agent & LLM 重点动态 Google 发布第八代 TPU,训练和推理各一颗芯片 Google 在 Cloud Next 上拿出 TPU 8t 和 TPU 8i,一颗管训练一颗管推理,直接针对 Agent 时代的计算需求做硬件分割

原文链接:https://mp.weixin.qq.com/s/tR155ypKp5Rwt5GYdx3PxQ

AI Agent & LLM

重点动态

Google 发布第八代 TPU,训练和推理各一颗芯片

Google 在 Cloud Next 上拿出 TPU 8t 和 TPU 8i,一颗管训练一颗管推理,直接针对 Agent 时代的计算需求做硬件分割。

Agent 工作负载跟传统推理很不一样,多步推理、工具调用、持续循环,延迟会被放大。Google 的解法是把训练和推理彻底分开设计。TPU 8t 单个 superpod 跑到 9600 颗芯片、2PB 共享显存、121 ExaFlops 算力,对标的是把前沿模型训练周期从月压到周。TPU 8i 则堆了 288GB HBM + 384MB 片上 SRAM,专门解决推理场景的”内存墙”问题。

有意思的是两款芯片都用上了 Google 自研的 Axion Arm CPU 做主机,NUMA 架构隔离,整个栈从硅到数据中心协同优化。能效比上一代翻倍,每瓦性能提升两倍。今年晚些时候 GA,现在可以申请早期访问。

封面

📎 相关链接

Our eighth generation TPUs
https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/

Qwen3.6-27B 开源,27B 密集模型跑赢 397B MoE

通义千问团队用 27B 参数的纯密集模型,在 SWE-bench、Terminal-Bench 等核心 Agent 编码基准上全面超越了上代旗舰 Qwen3.5-397B-A17B。

这个结果挺能说明问题的。27B 参数量只有 397B 的十五分之一,没有 MoE 路由开销,部署简单,但 SWE-bench Verified 拿到 77.2(上代 76.2),Terminal-Bench 2.0 直接从 52.5 跳到 59.3,追平了 Claude 4.5 Opus。SkillsBench 更夸张,从 30.0 到 48.2,接近翻倍。

密集模型的优势就是部署确定性高,不用操心专家路由的工程复杂度。同时支持多模态和思考/非思考两种模式,兼容 OpenClaw、Claude Code、Qwen Code 等主流编码助手。对需要在本地跑 Agent 编码的开发者来说,这可能是目前最实用的开源选择。

封面

📎 相关链接

Qwen3.6-27B Blog
https://qwen.ai/blog?id=qwen3.6-27b

OpenAI 推出 Workspace Agents,企业级 Agent 正式落地

OpenAI 给 ChatGPT Business/Enterprise 加了 Workspace Agents,可以在工作区里构建一次、全团队共享的自动化 Agent。

核心卖点是”构建一次,全团队复用”。Agent 可以定时执行任务,比如审查线索、汇总工单、生成报告,还能跨工具操作,更新 ticket、编辑文档、发消息。管理员可以设权限、审批检查点和审计日志。

说真的,这基本就是把 ChatGPT 的 Custom GPT 拉到了企业级,加上了 RBAC、审计、审批这些 IT 治理要素。目前是 Research Preview,支持 Business、Enterprise、Edu 和 Teachers 四个套餐。Agent 赛道的产品化竞赛越来越白热化了。

封面

📎 相关链接

Workspace Agents for Business
https://openai.com/business/workspace-agents/

claude-reforge,给 Claude Code 加上跨会话持久记忆

一个开源项目,让 Claude Code 能记住之前犯过的错、用过的方案和发现的模式,跨会话累积经验。

编码 Agent 的一个痛点是每次新会话都从零开始。claude-reforge 的思路是在后台自动捕获 Claude Code 的错误、修复方案和代码模式,存到本地知识库,下次遇到类似问题时自动注入上下文。

用 JavaScript 写的,集成方式也比较轻量。对重度 Claude Code 用户来说,这解决的是一个真实痛点,尤其是长期维护大型项目时,反复踩同一个坑的概率不低。

封面

📎 相关链接

claude-reforge
https://github.com/Pinperepette/claude-reforge

K-Dense-AI/mimeo,把领域专家”复印”成 Agent 技能文件

Mimeo 能把一个领域专家的知识和经验提炼成 SKILL.md 或 AGENTS.md,直接喂给编码 Agent 使用。

思路很直接,你有一个在某个领域很厉害的人,把他处理问题的模式、偏好和经验提取成结构化文档,Agent 就能”继承”这个专家的工作方式。Python 实现,定位更偏 Agent 技能工程的工具链层面。

封面

📎 相关链接

mimeo
https://github.com/K-Dense-AI/mimeo

Hermes Agent 中文指南发布,16 册 30 万字

社区为 Hermes Agent 框架写了一套完整的中文指南,从安装部署到多 Agent 编排全覆盖。

Hermes Agent 继承了 OpenClaw 的基因,在记忆系统和自动化能力上做了升级。但文档分散一直是痛点,这套指南填补了这个空白。30 万字覆盖单 Agent 操控到多 Agent 编排的完整路径,对想深入 Agent 开发的中文开发者来说算是一个不错的入门资源。

封面

📎 相关链接

hermes-agent-guide
https://github.com/jwangkun/hermes-agent-guide

TON 鲸鱼跟单机器人,Claude AI 做信号过滤

在 TON 链上监控大户钱包,用 Claude AI 过滤交易信号,自动跟单并推送 Telegram 告警。

DeFi 跟单不是新概念,但用 LLM 做信号过滤层倒是比较新颖。传统的跟单策略一般是基于规则,用 Claude 做语义判断可能能识别出一些规则难以捕捉的模式。Python 实现,支持 STON.fi 和 DeDust。

封面

📎 相关链接

ton-whale-copier
https://github.com/genoshide/ton-whale-copier

GPT Image 2 技能包,12+ 类别的图像生成 Prompt 模板

一套为 Claude Code / Codex / OpenCode 打造的 GPT Image 2 技能文件,覆盖中文字体、科研配图、海报设计等 12 个类别。

本质是高质量的 Prompt 工程成果集,打包成 Agent 可以直接调用的技能格式。对需要让编码 Agent 同时产出视觉内容的场景挺实用,比如技术博客配图、科研论文插图等。

封面

📎 相关链接

gpt_image_2_skill
https://github.com/wuyoscar/gpt_image_2_skill

Polymarket 套利机器人开源

Figure Markets 开源的 Polymarket 套利交易机器人,TypeScript 实现,专注预测市场跨平台价差。

预测市场套利的核心逻辑跟传统金融套利类似,在不同平台间捕捉定价偏差。这个项目把整套流程自动化了,对关注 Web2+预测市场交叉机会的量化开发者有参考价值。

封面

📎 相关链接

polymarket-arbitrage-bot
https://github.com/figure-markets/polymarket-arbitrage-bot

下午见。


💬 本文评论区已开启,但暂无读者留言。

本文转载自微信公众号,如有侵权请联系删除。

  • 标题: Hermes Agent 中文指南发布,16 册 30 万字
  • 作者: lxiol
  • 创建于 : 2026-05-06 19:52:51
  • 更新于 : 2026-05-12 16:07:03
  • 链接: https://blog.lxiol.cn/2026/05/06/Hermes-Agent-中文指南发布16-册-30-万字/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。