Hermes Agent 操作本地浏览器(非无头模式)
Hermes Agent 操作本地浏览器(非无头模式)
操作视频和应用场景
应用场景:目前绝大部分企业应用都采用 Browser/Server (浏览器/服务器)结构。这种方式意味着 AI 可以和企业应用打通,比如填写表单,点击链接,获取结果,然后再喂给 AI进行处理。原本需要人来做的事情,AI 可以直接来做了,人负责审查结果就可以了。这个应用场景还是很广的,随着 AI 越来越强,相信它的操作会越来越精确。
下面是在 Windows/macOS/Linux 上,用 CDP 把 Hermes Agent 连接到你自己 Chrome 实例的完整步骤(官方推荐方式)。
一、核心原理
- Hermes Agent 支持直接通过 **Chrome DevTools Protocol(CDP)**接管本地 Chrome,而不依赖云浏览器(如 Browserbase)。
- 本质:用
--remote-debugging-port=9222启动 Chrome → Hermes 通过 WebSocket 连接该端口 → 直接操控你的 Chrome 实例(复用你的 Cookie/登录态)。
二、第一步:用远程调试模式启动 Chrome(关键)
必须单独起一个带调试端口的 Chrome 实例,最好指定独立用户目录,避免和你日常 Chrome 冲突。
✅ macOS(终端执行)
1 | `"/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" \ |
✅ Linux(终端执行)
1 | `google-chrome \ |
✅ Windows(CMD 执行)
1 | `"C:\Program Files\Google\Chrome\Application\chrome.exe" ^ |
参数说明:
--remote-debugging-port=9222:开启 CDP 调试端口(默认 9222)。--user-data-dir:独立配置目录,不污染你日常 Chrome 配置。--no-first-run:跳过首次启动弹窗。验证是否成功:浏览器打开 http://localhost:9222/json,能看到 JSON 列表即正常。
三、第二步:Hermes Agent 连接本地 Chrome
1. 启动 Hermes CLI
正常登录 Hermes Agent,进入交互界面。
2. 执行连接命令(三选一)
1 | `# 1. 默认连接本地 9222 端口(最常用) |
成功提示:
Connected to local Chrome via CDP。失败常见原因:
端口 9222 被占用 → 换端口(如 9223)并同步命令。
已开日常 Chrome 但未指定
user-data-dir→ 关闭所有 Chrome,重试第一步命令。
四、第三步:正常使用浏览器工具
连接后,Hermes 所有浏览器能力都会走你的本地 Chrome:
- 自动打开标签、导航、点击、输入、截图。
- 直接复用你 Chrome 的登录态/Cookie(不用重新登录)。
- 你能实时看到浏览器操作过程。
常用命令:
1 | `/browser status # 查看连接状态 |
五、常见问题
连接超时
确认 Chrome 是用上面命令启动的(不是普通双击)。
访问 http://localhost:9222/json 能打开吗?不能就是 Chrome 启动参数错。
和日常 Chrome 冲突
必须用
--user-data-dir单独启动一个实例,不要接管默认配置。Windows 提示路径错误
确认
chrome.exe路径正确(也可能在C:\Program Files (x86)\Google\Chrome\Application\chrome.exe)。
六、一键总结
- 用带
--remote-debugging-port=9222和独立user-data-dir的命令启动 Chrome。 - Hermes CLI 执行
/browser connect。 - 直接用本地 Chrome 自动浏览,零云成本、复用会话、可视操作。
💬 本文评论区已开启,但暂无读者留言。
本文转载自微信公众号,如有侵权请联系删除。
- 标题: Hermes Agent 操作本地浏览器(非无头模式)
- 作者: lxiol
- 创建于 : 2026-05-06 19:47:56
- 更新于 : 2026-05-12 16:07:03
- 链接: https://blog.lxiol.cn/2026/05/06/Hermes-Agent-操作本地浏览器非无头模式/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。