我把 Kimi K2.6 装进 Hermes,连干了 13 小时

lxiol
📝
Hermes+K2.6 跑通教程

原文链接:https://mp.weixin.qq.com/s/bCyCJpqWzYoQOSPPbbSRDw

Hermes+K2.6 跑通教程

周一早上,你给 AI 下了一个命令:”帮我把这份金融撮合引擎的代码性能优化到极限。”

你去睡了一觉。

周二醒来,AI 发消息告诉你:任务完成。它连续工作了 13 小时,发起 1000 余次工具调用,迭代了 12 套优化策略,最终把吞吐量从 0.43 MT/s 提升到了 1.24 MT/s——涨了 185%。

这不是科幻。这是最近使用 Kimi K2.6 的真实验证案例。

而当你把 K2.6 的大脑装进 Hermes Agent 的身体里——这套 7×24 小时不间断工作的 AI 军团,就真的可以开始了。

Hermes Agent:开源、自进化、7×24 持续运行

**这篇文章要解决的问题:**如何把这个月刚开源、代码能力媲美 GPT-5.4 的 Kimi K2.6,接入开源 AI Agent 框架 Hermes,搭建一套真正能跑起来、能自我进化的 AI 工作流?从零到跑通,每一步都有命令。

01 / 今天讲的两个主角

Hermes Agent 是 Nous Research 出品的开源自主 AI Agent,MIT 协议,一行 curl 命令安装,支持 Linux / macOS / WSL2 / Android Termux。截至 今天,项目已在 GitHub 超 125k Stars,最新版本 v0.11.0

它有三个核心特征是别的 Agent 框架很难同时做到的:

**① 自我进化:**完成复杂任务后,能把解法自动封装成可复用的 Skill,下次遇到同类问题直接调用,越用越聪明。

**② 模型无关:**一条命令切换 LLM,支持 OpenRouter(200+ 模型)、OpenAI、Anthropic、Kimi、GLM 等,无需改代码。

**③ 多平台网关:**一个 gateway 进程接入 Telegram、Discord、Slack、微信、企业微信、飞书、钉钉——用手机发条消息,Agent 在服务器上开始干活。

Kimi K2.6 是月之暗面(Moonshot AI)于 2026 年 4 月 20 日正式发布并开源的旗舰代码模型,基于万亿参数 MoE 架构,许可证为 Modified-MIT。

为什么 K2.6 适合驱动 Agent    三个数字说明问题:

▸ SWE-Bench Pro 得分 58.6%,超过 GPT-5.4(57.7%)和 Claude Opus 4.6(65.4%),代码工程能力行业领先

▸ Agent 集群规模从 K2.5 的 100 个子 Agent 提升至 300 个,协作步骤从 1500 步扩展到 4000 步

▸ 支持 262K 超长上下文,多轮任务下来不会”忘事”,这正是 Agent 调度最需要的能力

02 / 前置准备:环境和密钥

开始之前,先把两件事搞定。

▌ 系统环境

Hermes Agent 支持 Linux、macOS、WSL2、Android Termux。Python 3.10+ 是硬性要求,内存建议 4GB+。Windows 用户需要先安装 WSL2,再在 WSL2 终端里操作——原生 Windows 环境不受支持。

▌ 获取 Kimi Code API Key

这里有一个很多人踩的坑,必须提前说清楚:

⚠️ 重要:Kimi 有两套独立的 API 体系,密钥不互通。
     → Moonshot 开放平台(api.moonshot.cn):用于普通对话 API,密钥格式 sk-xxx
     → Kimi Code 平台(api.kimi.com):专为 Agent/Coding 场景设计,密钥格式 sk-kimi-xxx
     接入 Hermes Agent 用的是 Kimi Code 平台,用错密钥会报 401 错误。

获取步骤:

  1. 访问 kimi.com,购买 Kimi Code 订阅(Allegretto 及以上套餐支持 API 调用)

  2. 进入控制台:kimi.com/code/console,点击「创建 API Key」

  3. 复制以 sk-kimi- 开头的密钥,妥善保管,这个 Key 只显示一次

关于套餐额度:Kimi Code 订阅额度是按周刷新的,不是按月。重度 Agent 开发下,一天高强度使用可消耗约 24% 周额度,周五就会触碰频率上限(每小时重置)。如果你打算跑多个 Agent 同时工作,建议提前备好 API 额度计算。

03 / 安装 Hermes Agent:一行命令搞定

打开终端,执行:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装脚本会自动处理所有 Python 依赖、路径配置,最后触发交互式配置向导。如果你之前用过 OpenClaw,安装时会询问是否导入历史配置——直接继承记忆和 Skill,相当方便。

安装完成后,验证版本:

hermes –version # 预期输出:

hermes v0.8.0 (v2026.4.8)

还可以跑诊断命令,确认环境没问题:

hermes doctor   # 运行诊断,检查依赖和配置完整性

hermes status   # 查看当前配置状态

04 / 核心步骤:接入 Kimi K2.6

接入 K2.6 有两条路:方法 A 用交互向导(推荐新手),方法 B 直接编辑配置文件(推荐老手)。

方法 A:交互向导(推荐)

执行模型选择命令:

hermes model

进入提供商选择菜单,依次操作:

  1. 在提供商列表中,向下滚动找到 More providers(更多提供商),回车进入

  2. 选择 Custom endpoint(自定义端点)

  3. 依次填入以下内容:

Base URL:https://api.kimi.com/coding/v1

API Key:sk-kimi-xxxxxxxxxx(你的密钥)

Model Name:kimi-for-coding

**⚠️ 注意模型 ID:**Kimi K2.6 在 API 层面的模型标识符是 kimi-for-coding,不是 kimi-k2.6

用错会报 404 model_not_found 错误。可以用下面这个命令验证可用模型:

curl -s https://api.kimi.com/coding/v1/models \

-H “Authorization: Bearer $KIMI_API_KEY” | jq ‘.data[].id’

预期输出:kimi-for-coding

方法 B:直接编辑配置文件

配置文件位于 ~/.hermes/config.yaml,密钥存在 ~/.hermes/.env

在 ~/.hermes/.env 中添加:

KIMI_API_KEY=sk-kimi-xxxxxxxxxx

在 ~/.hermes/config.yaml 中修改模型配置:

model:

default: “kimi-for-coding”

provider: “custom”

base_url: “https://api.kimi.com/coding/v1

改完保存,执行 hermes status 确认模型已切换为 kimi-for-coding。

05 / 让 Agent 跑起来:接入飞书/微信

光有 CLI 不够,把 Agent 接到你常用的聊天软件里,才是真正的 7×24 工作模式——你出门、睡觉,发条消息,Agent 就开始工作了。

hermes gateway setup

进入平台选择界面,最新版 v0.8.0 已内置飞书(Feishu/Lark)、企业微信、QQ、钉钉等国内平台。

⚠️ 高频踩坑:选飞书时一定要按空格键选中,不能直接回车!

把光标移到「Feishu/Lark」后直接回车,程序会认为你什么都没选就退出。要看到选项前有 ✅ 对勾,再按回车确认。

飞书接入完整流程:

  1. 空格键选中 Feishu/Lark,回车确认

  2. 选择「Scan QR code to create a new bot automatically」,终端会显示一个链接或二维码

  3. 用手机飞书扫码(或在浏览器打开链接),填写机器人名称,点击「创建」

  4. 创建成功后,先不要点击网页上的任何按钮,切回终端选「Use DM pairing approval」

  5. 选择「Respond only when @mentioned in groups」(群聊中仅被@时回复)

  6. 输入大写 Y 确认,将 gateway 安装为守护进程服务(选 User Service,无需 sudo 权限)

  7. 回到飞书网页,点击「打开机器人」,找到对应机器人,发一条消息,Agent 就上线了

之后每次启动 gateway:

hermes gateway start

Gateway 让 Agent 从服务器连入你的聊天软件

06 / 进阶:多 Agent 分工协作

单个 Agent 是工具,多个 Agent 协作才是生产力。Hermes 的 multi-profile 特性,让你可以复刻任意多个独立 Agent,每个有自己的模型配置、记忆和 Skill 集。

创建 Agent 分身有三种方式:

方式一:全新空白 Profile hermes profile create planner

方式二:复刻配置(保留 API Key,但记忆和会话独立) hermes profile create reviewer –clone

方式三:完整复制(记忆、会话、Skill 全部继承) hermes profile create curator –clone-all

切换到指定 Agent 只需加 -p 参数:

hermes -p planner

启动 Planner Agent hermes -p reviewer

启动 Reviewer Agent

一个真实的三角协作分工模式:

🔵 总管 Agent(K2.6-code-preview 驱动)——负责任务拆解和调度,需要超长上下文保证多轮对话不断线,262K 的窗口是首选。

🟡 执行 Agent—— 接受总管拆解的子任务,负责具体代码执行、文件操作、工具调用。

🔴 验收 Agent—— 验收执行结果,评估质量,决定是否返工或上线。

如果你有 23 个 Agent 都在跑,想一次性把它们全部切换到 K2.6,不用逐一改配置,发一条指令就能批量更新:

告诉 Hermes 执行批量切换

发送这条指令给你的主 Agent(TUI 中输入):

“把所有 profile 的 provider 切换到 kimi-coding,

base_url 改为 https://api.kimi.com/coding/v1,

并同步 KIMI_API_KEY 到所有 profile 的 .env,

完成后重启所有 gateway”

07 / 踩坑实录

❌ 问题一:401 Invalid Authentication

**根因:**用了 api.moonshot.cn 的端点配 sk-kimi- 的 Key,或者反过来。两套体系密钥不通用。
**解决:**确认 base_url 是 https://api.kimi.com/coding/v1,密钥是 Kimi Code 控制台签发的 sk-kimi- 开头的那个。

❌ 问题二:多个 Profile 启动后,API Key 只有主 Profile 有

**根因:**全局 ~/.hermes/.env 有 KIMI_API_KEY,但各 profile 子目录下的 .env 里没有。创建 –clone 时不会自动同步 Key。
**解决:**K2.6 的自动修复 Skill 能检测这个问题,告诉主 Agent「帮我把 KIMI_API_KEY 同步到所有 profile 的 .env」,它会自动处理。

❌ 问题三:429 API rate limit reached

**根因:**Kimi Code 订阅按周刷新,且单个 Key 有每小时频率限制。多个 Agent 同时跑,Token 消耗比单用户感知高出一个量级。
**解决:**重度多 Agent 场景建议提前订阅更高等级套餐;也可以给不同 Agent 配置不同的 API Key,分散频率压力。

❌ 问题四:飞书机器人选择时直接回车、啥都没选

根因:Hermes 的平台选择是多选界面,光标移到选项上后需要按空格键才算选中,再按回车确认。直接回车等于没选任何平台退出。
**解决:**看到选项前出现 ✅ 对勾,再按回车。

08 / 说实话:K2.6 的短板在哪

这套组合很强,但也不是完美的。用之前需要知道几件事:

**纯推理能力不是 K2.6 的长项。**HLE-Full(博士级纯推理)得分 34.7%,低于 GPT-5.4 的 39.8%。如果你的工作流里有大量纯数学推导或逻辑证明,可以考虑用 OpenRouter 在 Hermes 里接入 Claude Opus 4.7 做这部分工作,K2.6 专注 Agent 调度和代码执行。

**视觉理解有差距。**MathVision 87.4% 对比 GPT-5.4 的 92.0%,在需要理解图表、截图分析的任务上,效果略逊。

**额度管理要精细。**多 Agent 并行跑的消耗远超单用户感知,使用前要算清楚一周的 Token 预算够不够。

K2.6 + Hermes 最适合的场景是****代码执行、系统工程优化、长程多步骤自主任务。如果你的核心需求是这三类,这套组合在同等价位里,很难找到更好的选择。

09 / 最后说几句

AI Agent 这件事真的变了。不是大家说了很久的”AI 会取代程序员”——那个命题太宏大,也太模糊。而是具体地:一个运行在你服务器上、接入飞书的 Agent,可以连续工作 13 小时,发起上千次工具调用,把一个你觉得”优化到极限”的系统再提升 185%。

这不是未来,这是今天的事。

当然,跑通这套系统需要一些配置成本。你会遇到密钥体系的混淆、飞书接入的坑、API 频率的限制。但这些问题都是确定性的——意味着遇到了按照文章排查,都能解决。

Hermes Agent 是工具箱,Kimi K2.6 是发动机。装好了,就可以开车了。

快速回顾:5 步跑通全流程
① 在 kimi.com/code/console 创建 sk-kimi- 开头的 API Key

② curl -fsSL https://...install.sh | bash 安装 Hermes Agent v0.8.0

③ hermes model → Custom endpoint → 填入 api.kimi.com/coding/v1 和 kimi-for-coding

④ hermes gateway setup → 接入飞书/企业微信(空格选中,再回车)

⑤ hermes gateway start → 开跑


💬 本文评论区已开启,但暂无读者留言。

本文转载自微信公众号,如有侵权请联系删除。

  • 标题: 我把 Kimi K2.6 装进 Hermes,连干了 13 小时
  • 作者: lxiol
  • 创建于 : 2026-05-06 19:51:13
  • 更新于 : 2026-05-12 16:07:04
  • 链接: https://blog.lxiol.cn/2026/05/06/我把-Kimi-K26-装进-Hermes连干了-13-小时/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。