Hermes Agent 操作本地浏览器(非无头模式)

lxiol
📝
Hermes Agent 操作本地浏览器(非无头模式)

原文链接:https://mp.weixin.qq.com/s/8ff8jBZC9P3tJnNu1Cdjkw

Hermes Agent 操作本地浏览器(非无头模式)

操作视频和应用场景

应用场景:目前绝大部分企业应用都采用 Browser/Server (浏览器/服务器)结构。这种方式意味着 AI 可以和企业应用打通,比如填写表单,点击链接,获取结果,然后再喂给 AI进行处理。原本需要人来做的事情,AI 可以直接来做了,人负责审查结果就可以了。这个应用场景还是很广的,随着 AI 越来越强,相信它的操作会越来越精确。

下面是在 Windows/macOS/Linux 上,用 CDP 把 Hermes Agent 连接到你自己 Chrome 实例的完整步骤(官方推荐方式)。

一、核心原理

  • Hermes Agent 支持直接通过 **Chrome DevTools Protocol(CDP)**接管本地 Chrome,而不依赖云浏览器(如 Browserbase)。
  • 本质:用--remote-debugging-port=9222启动 Chrome → Hermes 通过 WebSocket 连接该端口 → 直接操控你的 Chrome 实例(复用你的 Cookie/登录态)。

二、第一步:用远程调试模式启动 Chrome(关键)

必须单独起一个带调试端口的 Chrome 实例,最好指定独立用户目录,避免和你日常 Chrome 冲突。

✅ macOS(终端执行)

1
2
3
4
5
`"/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" \
  --remote-debugging-port=9222 \
  --user-data-dir="$HOME/.hermes/chrome-debug" \
  --no-first-run \
  --no-default-browser-check`

✅ Linux(终端执行)

1
2
3
4
5
`google-chrome \
  --remote-debugging-port=9222 \
  --user-data-dir="$HOME/.hermes/chrome-debug" \
  --no-first-run \
  --no-default-browser-check`

✅ Windows(CMD 执行)

1
2
3
4
5
`"C:\Program Files\Google\Chrome\Application\chrome.exe" ^
  --remote-debugging-port=9222 ^
  --user-data-dir="%USERPROFILE%\.hermes\chrome-debug" ^
  --no-first-run ^
  --no-default-browser-check`
  • 参数说明:

  • --remote-debugging-port=9222:开启 CDP 调试端口(默认 9222)。

  • --user-data-dir:独立配置目录,不污染你日常 Chrome 配置

  • --no-first-run:跳过首次启动弹窗。

  • 验证是否成功:浏览器打开 http://localhost:9222/json,能看到 JSON 列表即正常。

三、第二步:Hermes Agent 连接本地 Chrome

1. 启动 Hermes CLI

正常登录 Hermes Agent,进入交互界面。

2. 执行连接命令(三选一)

1
2
3
4
5
6
7
8
`# 1. 默认连接本地 9222 端口(最常用)
/browser connect

# 2. 指定 CDP 地址(如端口或主机不同)
/browser connect ws://localhost:9222

# 3. 连接后查看状态
/browser status`
  • 成功提示:Connected to local Chrome via CDP

  • 失败常见原因:

  • 端口 9222 被占用 → 换端口(如 9223)并同步命令。

  • 已开日常 Chrome 但未指定user-data-dir → 关闭所有 Chrome,重试第一步命令。

四、第三步:正常使用浏览器工具

连接后,Hermes 所有浏览器能力都会走你的本地 Chrome:

  • 自动打开标签、导航、点击、输入、截图。
  • 直接复用你 Chrome 的登录态/Cookie(不用重新登录)。
  • 你能实时看到浏览器操作过程

常用命令:

1
2
`/browser status      # 查看连接状态
/browser disconnect  # 断开本地 Chrome,切回云/无头模式`

五、常见问题

  • 连接超时

  • 确认 Chrome 是用上面命令启动的(不是普通双击)。

  • 访问 http://localhost:9222/json 能打开吗?不能就是 Chrome 启动参数错。

  • 和日常 Chrome 冲突

  • 必须用--user-data-dir单独启动一个实例,不要接管默认配置。

  • Windows 提示路径错误

  • 确认chrome.exe路径正确(也可能在C:\Program Files (x86)\Google\Chrome\Application\chrome.exe)。

六、一键总结

  • 用带--remote-debugging-port=9222和独立user-data-dir的命令启动 Chrome。
  • Hermes CLI 执行/browser connect
  • 直接用本地 Chrome 自动浏览,零云成本、复用会话、可视操作

💬 本文评论区已开启,但暂无读者留言。

本文转载自微信公众号,如有侵权请联系删除。

  • 标题: Hermes Agent 操作本地浏览器(非无头模式)
  • 作者: lxiol
  • 创建于 : 2026-05-06 19:47:56
  • 更新于 : 2026-05-12 16:07:03
  • 链接: https://blog.lxiol.cn/2026/05/06/Hermes-Agent-操作本地浏览器非无头模式/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。