📝

/images/Hermes-Agent-中文指南发布16-册-30-万字/c635dbb296d4。png AI Agent & LLM 重点动态 Google 发布第八代 TPU，训练和推理各一颗芯片 Google 在 Cloud Next 上拿出 TPU 8t 和 TPU 8i，一颗管训练一颗管推理，直接针对 Agent 时代的计算需求做硬件分割

原文链接：https://mp.weixin.qq.com/s/tR155ypKp5Rwt5GYdx3PxQ

AI Agent & LLM

重点动态

Google 发布第八代 TPU，训练和推理各一颗芯片

Google 在 Cloud Next 上拿出 TPU 8t 和 TPU 8i，一颗管训练一颗管推理，直接针对 Agent 时代的计算需求做硬件分割。

Agent 工作负载跟传统推理很不一样，多步推理、工具调用、持续循环，延迟会被放大。Google 的解法是把训练和推理彻底分开设计。TPU 8t 单个 superpod 跑到 9600 颗芯片、2PB 共享显存、121 ExaFlops 算力，对标的是把前沿模型训练周期从月压到周。TPU 8i 则堆了 288GB HBM + 384MB 片上 SRAM，专门解决推理场景的”内存墙”问题。

有意思的是两款芯片都用上了 Google 自研的 Axion Arm CPU 做主机，NUMA 架构隔离，整个栈从硅到数据中心协同优化。能效比上一代翻倍，每瓦性能提升两倍。今年晚些时候 GA，现在可以申请早期访问。

Qwen3.6-27B 开源，27B 密集模型跑赢 397B MoE

通义千问团队用 27B 参数的纯密集模型，在 SWE-bench、Terminal-Bench 等核心 Agent 编码基准上全面超越了上代旗舰 Qwen3.5-397B-A17B。

这个结果挺能说明问题的。27B 参数量只有 397B 的十五分之一，没有 MoE 路由开销，部署简单，但 SWE-bench Verified 拿到 77.2（上代 76.2），Terminal-Bench 2.0 直接从 52.5 跳到 59.3，追平了 Claude 4.5 Opus。SkillsBench 更夸张，从 30.0 到 48.2，接近翻倍。

密集模型的优势就是部署确定性高，不用操心专家路由的工程复杂度。同时支持多模态和思考/非思考两种模式，兼容 OpenClaw、Claude Code、Qwen Code 等主流编码助手。对需要在本地跑 Agent 编码的开发者来说，这可能是目前最实用的开源选择。

📎 相关链接

Qwen3.6-27B Blog
https://qwen.ai/blog?id=qwen3.6-27b

OpenAI 推出 Workspace Agents，企业级 Agent 正式落地

OpenAI 给 ChatGPT Business/Enterprise 加了 Workspace Agents，可以在工作区里构建一次、全团队共享的自动化 Agent。

核心卖点是”构建一次，全团队复用”。Agent 可以定时执行任务，比如审查线索、汇总工单、生成报告，还能跨工具操作，更新 ticket、编辑文档、发消息。管理员可以设权限、审批检查点和审计日志。

说真的，这基本就是把 ChatGPT 的 Custom GPT 拉到了企业级，加上了 RBAC、审计、审批这些 IT 治理要素。目前是 Research Preview，支持 Business、Enterprise、Edu 和 Teachers 四个套餐。Agent 赛道的产品化竞赛越来越白热化了。

📎 相关链接

Workspace Agents for Business
https://openai.com/business/workspace-agents/

claude-reforge，给 Claude Code 加上跨会话持久记忆

一个开源项目，让 Claude Code 能记住之前犯过的错、用过的方案和发现的模式，跨会话累积经验。

编码 Agent 的一个痛点是每次新会话都从零开始。claude-reforge 的思路是在后台自动捕获 Claude Code 的错误、修复方案和代码模式，存到本地知识库，下次遇到类似问题时自动注入上下文。

用 JavaScript 写的，集成方式也比较轻量。对重度 Claude Code 用户来说，这解决的是一个真实痛点，尤其是长期维护大型项目时，反复踩同一个坑的概率不低。

K-Dense-AI/mimeo，把领域专家”复印”成 Agent 技能文件

Mimeo 能把一个领域专家的知识和经验提炼成 SKILL.md 或 AGENTS.md，直接喂给编码 Agent 使用。

思路很直接，你有一个在某个领域很厉害的人，把他处理问题的模式、偏好和经验提取成结构化文档，Agent 就能”继承”这个专家的工作方式。Python 实现，定位更偏 Agent 技能工程的工具链层面。

Hermes Agent 中文指南发布，16 册 30 万字

社区为 Hermes Agent 框架写了一套完整的中文指南，从安装部署到多 Agent 编排全覆盖。

Hermes Agent 继承了 OpenClaw 的基因，在记忆系统和自动化能力上做了升级。但文档分散一直是痛点，这套指南填补了这个空白。30 万字覆盖单 Agent 操控到多 Agent 编排的完整路径，对想深入 Agent 开发的中文开发者来说算是一个不错的入门资源。

TON 鲸鱼跟单机器人，Claude AI 做信号过滤

在 TON 链上监控大户钱包，用 Claude AI 过滤交易信号，自动跟单并推送 Telegram 告警。

DeFi 跟单不是新概念，但用 LLM 做信号过滤层倒是比较新颖。传统的跟单策略一般是基于规则，用 Claude 做语义判断可能能识别出一些规则难以捕捉的模式。Python 实现，支持 STON.fi 和 DeDust。

GPT Image 2 技能包，12+ 类别的图像生成 Prompt 模板

一套为 Claude Code / Codex / OpenCode 打造的 GPT Image 2 技能文件，覆盖中文字体、科研配图、海报设计等 12 个类别。

本质是高质量的 Prompt 工程成果集，打包成 Agent 可以直接调用的技能格式。对需要让编码 Agent 同时产出视觉内容的场景挺实用，比如技术博客配图、科研论文插图等。

Polymarket 套利机器人开源

Figure Markets 开源的 Polymarket 套利交易机器人，TypeScript 实现，专注预测市场跨平台价差。

预测市场套利的核心逻辑跟传统金融套利类似，在不同平台间捕捉定价偏差。这个项目把整套流程自动化了，对关注 Web2+预测市场交叉机会的量化开发者有参考价值。

📎 相关链接

polymarket-arbitrage-bot
https://github.com/figure-markets/polymarket-arbitrage-bot

下午见。

💬 本文评论区已开启，但暂无读者留言。

本文转载自微信公众号，如有侵权请联系删除。