—title: (可能全网最全/长的)Hermes Agent+K2.6 保姆教程 + 实战案例
date: 2026-04-27 19:43:01
summary: title: (可能全网最全/长的)Hermes Agent+K2。6 保姆教程 + 实战案例 date: 2026-04-27 19:43:01 summary:
tags:
- Hermes
- AI Agent
- 终端
- 浏览器
- Git
- Docker
- 开源
- macOS
- 微信转载
categories: - 转载—
本来都不打算写Hermes保姆教程了,无奈我之前似乎无意间立了个“专写万字保姆教程”的人设,有N多同学在后台和微信里私信问保姆教程咋还没写😂,那…就今天补上!(结尾有彩蛋)
一、前置条件
本地Mac/Linux/Windows WSL2
或
腾讯云主机一台:
•
轻量应用服务器Lighthouse,自带流量和带宽,对绝大多数新手来说性价比友好;
•
2核4G或以上配置;
•
https://buy.cloud.tencent.com/lighthouse 新手推荐选择入门型2核4G配置:

•
登录方式推荐SSH(密钥配对方式,需要创建并保存一个.pem密钥文件,请一定记住该文件的保存位置,后续会经常用到)
•
Ubuntu镜像(用户名默认ubuntu);
•
海外节点(新加坡、曼谷、东京、首尔都可以)

•
备注:
•
其他云厂商(阿里云、火山引擎甚至AWS)的云主机皆可,我只是自己用惯了腾讯云,所以本文中皆以腾讯云示例;
•
也可以是MacOS、Linux、Windows WSL2等本地电脑,这种情况会省去Remote-SSH相关的配置;
•
但我强烈推荐海外节点云主机的方式来部署Hermes Agent,理由如下:
1.
下载各种依赖库、Github仓库、Docker Hub镜像等速度快很多(无须魔法);
在哪里都可以访问;
大的云厂商机房的SLA肯定要比在家里摆一台Mac Mini要稳得多……
使用DNS配置公网域名更简便,随时随地在手机上可以vibe一个你自己域名下的网站出来;
大模型推荐:KIMI K2.6
上周KIMI的Coding Plan全量推送了K2.6-code-preview,所以我已经使用K2.6一周多时间了。我有4个Hermes Agent,其中3个跑在K2.6上,一个跑在GPT-5.4上,在Hermes Agent上的体验KIMI K2.6和GPT-5.4可以打的有来有回!并且,由于GPT-5.4说话又臭又长还满嘴“黑话”,而KIMI K2.6说话比较简洁,我甚至更喜欢和K2.6搭伙干活儿。
刚好,KIMI昨晚正式发布了KIMI K2.6~

•
更强的长程编码能力
•
更强前端设计和编排能力
•
和Hermes/OpenClaw等更匹配的自主Agent协同能力
从KIMI官宣改进方向、benchmark以及Hermes官方(NOUS Research)的comments上看,的确和我的使用体感非常match!


此外,KIMI家的KIMI Code非常适合作为Hermes(或OpenClaw)的陪跑Agent,后文详述。

如果你选择云主机,请配置好VS Code的Remote-SSH
•
使用VS Code 在 ~/.ssh/config 文件中填入云主机的信息:
1 | `Host hermes-agent / 备注:主机名称 |
如果你不会填写,也可以将主机IP信息和密钥文件告知你安装在本地的Agent(比如KIMI Code),由该Agent来帮你配置 ssh的config文件~ 配置完成之后,
•
配置好之后,可以在VS Code中通过快捷键 cmd+shift+P(windows是ctrl+shift+P)

•
搜索并点击Remote-SSH:连接到主机,然后选择刚才配置好的主机名称:

•
首次连接大概需要一两分钟时间,连接成功后,可以在VS Code左下角看到“SSH-服务器名”

•
连接成功之后,就可以在Panel(面板)中使用Terminal(终端)来完成后续的安装和配置了

如果你实在不会配置Remote-SSH和使用VS Code进行Remote-SSH连接,那可以使用腾讯云提供的服务器登录可视化界面(Orca):

注意要选择“终端连接(SSH)”;
验证方式取决于你购买服务器时选择的是密码还是密钥;

登录成功之后,后续的安装方式都适用于此形式

手边准备好Hermes Agent的文档随时翻阅:
我汉化的Hermes Doc中文站: https://hermes-doc.aigc.green/
当准备好以上前置条件后,就可以开始安装Hermes Agent了,具体步骤如下:
二、Hermes Agent的安装和配置
•
如果是直接在本地Mac/Linux/Windows WLS2中安装,在Terminal(终端)输入如下安装指令启动Hermes Agent的安装;
•
如果使用云主机,则通过Remote-SSH方式连接,在Terminal(终端)里输入如下指令:
1 | `curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash` |
•
请注意:对于小白用户,为了后续使用方便,建议在ubuntu用户下安装,请注意输入命令前面的 ubuntu@VM-xxxxxx 表示当前使用ubuntu用户登录并在该用户下安装Hermes Agent;

•
如果是一台全新的云主机,安装过程大概会持续10分钟左右;安装完成之后,会看到如下界面,选择“Quick setup”:

•
在Select Provider(大模型提供商选择)界面,选择Kimi Coding Plan

•
在这个界面中将Kimi Code的API KEY粘贴进来(注意:屏幕上并不会显示出粘贴进去的API KEY,用键盘的粘贴快捷键完成粘贴之后,直接回车即可!)

•
如果API KEY正确,那么会显示大模型选择界面,选择“kimi-for-coding”即可(这个endpoint背后就是最新的K2.6-code-preview):

•
接下来是配置聊天软件的连接,选择“set up messaging now”

•
最新版本的Hermes Agent已经将飞书、企微、钉钉、微信、QQ等国内软件都放到了选项中,这里我们还是选择飞书(Feishu/Lark):

•
注意,这里有个坑:一定要按下空格键来选中Feishu/Lark !!!!!!!!!!!
•
如果你把光标移到Feishu/Lark的位置然后直接点击回车,程序会认为你什么Gateway都不选直接退出!
•
要看到Feishu/Lark前面有个对勾✅;然后,按下键盘上的“回车键”:

•
进入配置方式选择,直接选择“Scan QR code to create a new bot automatically”

•
出现以下提示时,可以将红线中的链接发到自己的飞书里用手机打开,或者直接在浏览器中打开该连接:

•
如果你提前使用 pip install qrcode 命令安装过二维码依赖库,那么在这里可以看到一个二维码,用手机飞书直接扫描二维码即可
•
假设在浏览器中直接打开该连接,则可以在该页面内填写Hermes Agent对应的飞书机器人的名称,然后点击“创建”按钮:

•
飞书自动创建机器人(大概等待十几秒):

•
创建完成之后,会看到下面的界面,先不要点击任何按钮:

•
让我们先切换回Terminal(终端)的安装界面,选择“Use DM pairing approval”(即配对码配对):

•
选择“Respond only when @mentioned in groups”(群聊中仅被@时才回复消息)

•
然后在这个界面下直接回车(不配置Home chat ID,后续再说)

•
在这个界面输入大写“Y”,然后回车(安装Gateway作为守护进程服务):

•
在接下来的界面中选择“User Service”(无须sudo超管权限)

•
输入”Y“,并回车(启动服务):

•
显示配置成功:

•
回到刚才创建飞书机器人的网页中,点击“打开机器人”,会通过deeplink唤起飞书客户端,并跳转到这个机器人的聊天界面:


•
给机器人发送消息,会收到一串配对码 hermes pairing approve feishu xxxxxxxx

•
在Terminal(终端)中输入这串配对码命令:

•
然后重新回到飞书中和Hermes Agent机器人对话:

•
OK,Hermes Agent机器人已经可以正确回复消息了!当然,你还可以按照上图的提示,在聊天界面中输入 /sethome 来将当前聊天窗口作为默认界面,后续如果有cron-job(定时任务)会默认发到这个聊天窗口中:


•
接下来,为了确保hermes指令可以在$PATH被正确识别,让我们先在命令行中输入:
1 | `source $HOME/.local/bin/env` |
•
然后,让我们在Terminal(终端)中输入 hermes 测试下Hermes Agent是否可以在Terminal里正常沟通了
•
应该会出现Hermes 的TUI(Terminal UI)界面:

•
可以先观察一下聊天框上面的一些元素:
•
kimi-for-coding:你正在使用的大模型;
•
ctx:上下文窗口;
•
7s:当前session持续时间长度;

•
此外,你还可以在Terminal(终端)输入 hermes dashboard 来启动浏览器上的WebUI

•
绿油油的Hermes WebUI:

OK,Hermes Agent的安装基本完成了。
三、安装飞书CLI,打造你的数字座舱
•
Hermes Agent官方给出的各平台能力列表中,国内平台中飞书覆盖最全面,这也是为什么我一直推荐飞书作为首选。

•
除了机器人的基础能力外,我推荐安装飞书CLI来进一步增强对于飞书基建的利用能力。
•
飞书CLI: https://www.feishu.cn/feishu-cli

•
在安装Hermes Agent的主机Terminal(终端)输入:npx @larksuite/cli@latest install,并输入“y”,回车:

•
选择“中文”,回车:

•
用飞书app扫描弹出的二维码:

•
在手机上完成飞书CLI机器人的创建
•
选择“YES”

•
勾选要授权的业务(空格键=选中),然后回车:

•
选择你认为合适的权限:

•
在浏览器中打开相应链接完成授权

•
点击“开通并授权”按钮:

•
还需要管理员进行审批:


•
管理员通过审批后回到Terminal终端;
•
为了方便后续在终端使用飞书CLI,将lark-cli加入$PATH:
1 | `export PATH="/home/ubuntu/.hermes/node/bin:$PATH"` |
•
可以输入lark-cli --version 查看其版本号,看到类似lark-cli version 1.0.13的信息则表明环境变量已添加成功:

•
输入 lark-cli auth login, 然后再次勾选全部权限后点击链接完成授权,应该看到密密麻麻的scope授权

•
这时回到飞书聊天界面,和Hermes Agent机器人输入以下内容:
1 | `我已经在你所在的服务器完成了飞书CLI的登录和授权,请你检查一下你是否已经可以调用飞书CLI了;如果可以,请创建一个飞书文档(随便写点内容)来证明你可以正常使用飞书CLI` |

•
记得让Hermes把它创建的飞书文档的链接发给你,以防它忽悠你:

四、如果遇到自己手动解决不了的问题怎么办 – 安装陪跑Agent - KIMI Code
我推荐的大模型厂商是KIMI,而KIMI提供了KIMI Code这个相对轻量级的Coding Agent,你可以在安装Hermes对应的机器上安装KIMI Code来作为“陪跑”Agent帮你解决各种疑难杂症。
如果你使用的是VS Code
•
如果你是使用VS Code通过Remote-SSH连接云主机来安装Hermes,那么可以在VS Code的插件市场搜索并安装KIMI Code

•
安装成功后在侧边栏点击KIMI Code的图标

•
在界面中完成KIMI Code的登录
•
如果首次安装成功后打开KIMI插件是下图中这个状态,你需要点击“Open Folder”先打开一个文件目录;

•
然后会出现引导打开官网以完成鉴权的过程;
•
登录成功之后会变成如下状态:

如果你使用的是Terminal(终端)
你可以在
https://www.kimi.com/code?from=membership找到安装KIMI Code CLI的命令
•
在Terminal(终端)中输入curl -L code.kimi.com/install.sh | bash

•
安装完成后在Terminal(终端)中继续输入kimi 以启动KIMI Code CLI版。
•
当遇到一些疑难杂症时,你就可以把问题扔给KIMI Code,让它帮你解决,比如下图这个使用hermes update报错的问题:

当然,由于KIMI Code是个能力一点都不弱的Coding Agent,你完全可以让它在这台服务器上开发网站、App、skills等
•
另外,社群中有的同学说找不到KIMI的Coding Plan的API KEY和Token消耗量……可以直接通过以下网址进入:https://www.kimi.com/code/console

•
也可以在网页版左下角点击会员计划:

•
然后点击会员计划中的KIMI Code超链接:

•
然后在这个页面点击控制台:

•
然后就能看到Token消耗量和创建API KEY的入口了~

终极偷懒Tips:
如果你是先安装的KIMI Code,你完全可以让KIMI Code来帮你完成Hermes Agent的所有安装和配置!
你只需要将Hermes Agent的仓库”https://github.com/NousResearch/hermes-agent“ 喂给KIMI Code,然后跟它说“请帮我完成Hermes Agent的安装和配置”即可!
五、关于Hermes你需要知道的冷(/热)知识
配置文件 config.yaml
•
让我们先熟悉一下Hermes Agent的目录结构:

•
绝大多数的配置项都存储在config.yaml中,你可以使用VS Code等IDE来直接编辑这个文件,也可以直接在Terminal(终端)使用CLI命令行的方式直接配置,例如:
1 | `hermes config # 查看当前配置 |
更多配置文件相关内容,参见: https://hermes-doc.aigc.green/user-guide/configuration
此外:
你的密钥都存储在 .env 文件中,如果某个大模型的密钥失效了,也可以直接用VS Code等IDE直接编辑修改 .env文件中对应密钥~
对话相关记忆存储在 sessions/ 和 /memories/ 以及 state.db 中;
技能存储在 skills/ 中
如何在Hermes中创建多Agent
从上面的结构图可以看出来,Hermes的主Agent的workspace就是它的根目录,并不存在像OpenClaw的workspace/目录。
但是,当你使用profile命令在同一个Hermes实例中创建多Agent时,就会多出一个 profiles/ 目录,这个目录相当于Hermes的workspace了。
例如,要创建一个名为note-mananger的Agent:
1 | `hermes profile create note-mananger # 创建 profile 并生成 "note-mananger" 命令别名` |
注意:这时note-mananger已经是和主Agent(名为hermes)一样独立的Agent了,你在CLI命令行中对其进行操作时,要直接使用note-mananger,而不是hermes,例如:
1 | `note-mananger chat # 开始聊天 |
也可以使用仅克隆配置 (–clone)命令:
1 | `hermes profile create note-mananger --clone` |
将当前 Profile 的 config.yaml、.env 和 SOUL.md 复制到新 Profile 中。使用相同的 API 密钥和模型,但拥有全新的会话和记忆。你可以编辑 ~/.hermes/profiles/note-mananger/.env 来使用不同的 API 密钥,或者编辑 ~/.hermes/profiles/note-mananger/SOUL.md 来设定不同的性格。
新的Agent创建完成后,你也需要为其连接新的聊天软件的入口(依然以note-mananger为例):
1 | `note-mananger setup gateway` |
此外,当你使用特定的Agent启动TUI对话时,可以在对话框上方看到相应的Agent的名字:

皮肤
•
Hermes Agent有一个很酷的TUI界面,但其实它内置了很多“皮肤”,你可以在TUI中输入 /skin 看看有哪些皮肤

•
你可以在TUI中输入 /skin 皮肤名来切换TUI皮肤,比如 /skin poseidon 可以切换成海皇波塞冬的皮肤

•
然后你再开启一个新的Hermes TUI时,皮肤就生效了:

•
同理,你还可以得到下面这些皮肤:



•
你还可以从外部仓库安装更多的skins,比如: https://github.com/joeynyc/hermes-skins


如果有兴趣,你完全可以通过在
~/.hermes/skins/下创建 YAML文件的方式自定义自己的皮肤:
无须审批的全自动YOLO模式
Hermes在工作过程中会经常让你输入 /approve 来显式批准,有时会很让人烦躁:

或:

如果你认为风险可控,可以在对话中输入 /yolo 来启动全自动运行模式:

新建和恢复session
/reset 或者 /new 可以新创建一个session,两个指令是等效的,上下文窗口会重置:

注意:如果你希望精确恢复到某个session,你必须预先通过 /title {name} 方式给某个session命名,然后使用 /resume {name} 来进行恢复!极简示例如下

Personality预置聊天风格
你可以在~/.hermes/SOUL.md中修改Hermes Agent的个性,也可以在对话中临时切换它的聊天风格,一共有14种预置风格:

你只需要在对话中输入 /personality {个姓名} 就能激活相应的个性,比如:
1 | `/personality kawaii` |
Hermes Agent就会切换成可爱的说话风格,句子中会多很多emoji…

推理强度
对于某些大模型,有推理强度的设定,可以通过以下指令来调整推理强度:
/reasoning high
/reasoning medium
/reasoning low



记忆文件 MEMORY.md 和 USER.md
注意,两个非常重要的记忆文件MEMORY.md(工作记忆)和USER.md(对用户的认知)是有明确的字符数上限的,你不能无限制的往里面塞内容!
•
MEMORY.md 限制 2,200 个字符;
•
USER.md 限制 1,375 个字符;
外接记忆系统
Hermes Agent提供了8家外接记忆系统provider:

你可以(且仅可以)选择其中一家来配合Hermes Agent的内置记忆系统一起工作~
当你选择了特定的外接记忆系统时,你可以直接告知Hermes Agent你的选择,然后由它来指导和配合你完成后续的配置~
BTW,我目前是选择了配置最简单的免费本地版Holographic;后续打算试试OpenViking、Mem0、Honcho的效果;
或者,也可以在Terminal(终端)中输入下面的指令来触发外接记忆方案的接入过程~
1 | `hermes memory setup` |

记忆方案的接入过程及不在这里展开了~ 你的Hermes应该可以回答你的各种疑问。
Hermes的Skills
Hermes的skills存放在skills/目录下,但和OpenClaw不同的是,它是按照分类来组织skills的,也就是说,第一层层并不是skills本身,而是分类目录(自己封装的skill有时Hermes找不到合适的分类也会先放在第一层级),具体的skills会放在第二层级目录下:

这和Hermes官方skills hub( https://hermes-agent.nousresearch.com/docs/skills )的分类是一致的:

注意:当你创建了多Agent之后,其他的Agent的skills的位置在:
profiles/<Agent-Name>/skills目录下。
Skill进化机制可能是Hermes日常工作中最重要的能力(没有之一)。在和你一起工作时,Hermes Agent会频繁调用skill_manage能力,来进行:
•
如果不存在skill,但Hermes判断这个工作流需要skill,它就会自动创建(create)一个新的skill;
•
当已经存在skill,但Hermes发现它无法满足最新的情况变化时,它会自动调用patch、edit、write_file等能力对该skill进行升级;
•
当它认为某个skill的能力已经被其他skill的能力覆盖时,它会调用delete能力对无效的skill进行删除;
总之,skill即使对个人和组织know-how的沉淀,Hermes会在工作过程中不断创建新skill、升级已经存在的skill、删除无效的skill,这对于Hermes来说是个内禀的强制过程,这也就是为什么你会觉得Hermes越用越聪明。

所以,如果你觉得初始状态的Hermes还不太聪明,那请尽快敞开了用Hermes吧!
浏览器自动化能力
Hermes Agent官方推荐了若干浏览器自动化解决方案来进一步提高你的网络浏览和操作效率。
如果你使用的是云主机,我推荐Browser Use和CamoFox。

•
并且,Browser Use宣布Hermes Agent用户可以免费使用它们提供的云端浏览器自动化方案(你需要去https://cloud.browser-use.com/ 官网申请一个API Key然后告知Hermes Agent帮你做个简单配置)

•
CamoFox:可以提供基于Firefox的指纹伪装。
如果是你是用的本地电脑,那直接用CDP连接电脑上的浏览器就好了,可以直接复用网站的登录态。
实战(skills)
恭喜你,你现在拥有了这样一个极为强大的Agent环境:
•
脑子 = KIMi K2.6 (K2.6-code-preview)
•
Harness = Hermes(爱马仕/赫尔墨斯)
•
Chat & 文件管理 基建 = 飞书
这套环境让我在过去一周时间里,大幅度减少了对我那台Macbook Pro的依赖,70%以上工作完全在手机上完成;
并且,在这一周中,我高强度使用这套环境为自己搭建起了日常若干重要工作流,示例如下:
•
在飞书中撰写内容并推送到微信公众号草稿箱(上图为飞书文档,下图为微信公众号):


skill地址:https://github.com/dracohu2025-cloud/draco-skills-collection/blob/main/feishu-doc-to-wechat-draft
•
使用即梦Seedream(或Nano Banana)生成图片并上传飞书云盘:

skill地址:https://github.com/dracohu2025-cloud/draco-skills-collection/blob/main/jimeng-image
•
使用Seedance2.0生成视频并回传飞书云盘(Seedance2.0比较贵😂,下方示例仅为480p):

skill地址:https://github.com/dracohu2025-cloud/draco-skills-collection/blob/main/seedance-video-local
•
将EPUB电子书转换为双人播客(+smart PPT)并回传飞书云盘:
Skill地址:https://github.com/dracohu2025-cloud/draco-skills-collection/blob/main/epub2podcast
•
抓取某篇微信公众号内容并保存到飞书文档:
•
CamoFox版: https://github.com/dracohu2025-cloud/draco-skills-collection/blob/main/wechat-article-camofox
•
BrowserUse版: https://github.com/dracohu2025-cloud/draco-skills-collection/blob/main/wechat-article-browseruse
•
使用Remotion生成单词解释短视频:
•
https://github.com/dracohu2025-cloud/draco-skills-collection/blob/main/vocabulary-video-pipeline
前文提到过,skills即是个人和组织know-how或SOP的沉淀,除了Hermes Agent自己的内禀机制之外,自己也要注意养成将自己的工作流封装为skill的习惯,并且最好将这些skill放到Github仓库以未来跨Agent进行管理和安装~
彩蛋:
KIMI 2.6有极强的前端编排能力,刚好HeyGen又新发布了HyperFrames框架,这下,我们可以让KIMI K2.6来封装各种前端视频流
此外,我还让KIMI 2.6封装了100个HyperFrames原子化组件(部分示例如下):

Skill仓库地址:https://github.com/dracohu2025-cloud/draco-skills-collection/tree/main/hyperframes-explainer-video
逻辑上,从现在开始,你就可以用KIMI K2.6 + Hyperframe 生成视频来解释万物!
此外,我们还可以通过KIMI K2.6 + Manim的 方式来生成数学、物理方向的视频教程:
Skill地址:https://github.com/dracohu2025-cloud/draco-skills-collection/tree/main/manim-video-with-tts
写在最后
在过去两周左右的时间里,我在尝试抛开GUI(也就是带各种可视化界面的)软件,而完全拥抱只通过自然文字进行交流了的Agent交互模式,只要有工作流上的卡点,就自己封装skill或者把目前能找到的优质skill给Agent装上;这有点像是互联网早期“能否仅靠互联网不出家门生存一周”的挑战~ 从这两周的体验来看,即便无法做到100%,但目前KIMI K2.6+Hermes+飞书这个组合也无限接近了! 用到GUI的,也无非是类似申请注册API KEY这类事务性的工作,而这些工作被替代掉也并不存在技术门槛,只是软件设计的滞后性而已。
从CLI (Command Line Interface)到GUI(Graphical User Interface),再到AUI(Agent User Interface);
交互方式从命令行,到可视化界面,再到自然语言。
每次范式变革,都会导致“所有应用都需要被重做一遍”的狂潮!
此外,视觉不是不重要;相反,视觉会变得更重要!
重要到,当给你看一幅画时,你需要马上说出这幅画的风格,用自然语言对这幅画进行精准的描述(人脑反推);给你看一条视频时,你需要马上讲出这条视频的分镜设计!对,就是需要达到这个程度~
否则,你就几乎只能消费,而无法创作。而创作是价值的源泉!
而这,就是我下个阶段探索的方向!(正在搭建一个名为Graphics Academy的网站/应用,来帮助你(我自己)这些非科班出身的人来掌握上面👆描述的这种能力)~ 敬请期待!
💬 本文评论区已开启,但暂无读者留言。
本文转载自微信公众号,如有侵权请联系删除。
- 标题:
- 作者: lxiol
- 创建于 : 2026-04-27 19:43:01
- 更新于 : 2026-04-29 20:21:28
- 链接: https://blog.lxiol.cn/2026/04/27/可能全网最全长的Hermes-AgentK26-保姆教程-实战案例/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。