Browse.sh:给 AI Agent 装上「万能浏览器技能包」,268 个网站的自动化剧本直接拿
开源 268 个网站自动化技能,CLI 一键安装,小白也能上手

#浏览器Agent #开源技能 #AI自动化 #Browse.sh
长话短说
Browserbase 本周开源了 Browse.sh – 一个包含 268 个网站操作技能的开放目录。每个技能都是针对特定网站的”操作剧本”:从查中国高铁时刻表、搜 Airbnb 房源,到亚马逊比价、联邦快递查包裹。AI Agent 只需一行命令就能安装并执行这些技能,不需要你手写选择器或研究反爬策略。
268
网站技能
3.4k
GitHub ⭐
50×
Token 节省
小白先看懂:这东西到底是干什么的
想象你有个助手,你说”查一下明天北京到上海的高铁”,它就得自己去 12306 网站上找。问题在于:12306 的页面结构复杂、有反爬机制、查询参数藏在 JS 里–一个普通 AI Agent 光”搞懂怎么查”就可能折腾半天,还容易搞错。
Browse.sh 解决的就是这个问题。它把每个网站的操作方法打包成一个技能文件(Skill),里面写好了:这个网站用什么 API、DOM 选择器是什么、要不要登录、有没有反爬、怎么绕过。AI Agent 直接加载这个技能就能干活,不用自己研究。
目前收录了 268 个技能,覆盖 100+ 个类别:交通、旅行、电商、政府、医疗、金融……你用得上的大网站基本都在里面了。
**适合谁:**写 AI Agent 的开发者、做自动化工具的产品团队、需要从网页批量爬数据的分析师。
**不适合谁:**只想给自己的个人 AI 助手加个小功能、不想折腾命令行的普通用户。
Browse.sh 的底层架构
Browse.sh 不是一个网站,而是一个开放技能目录 + CLI 工具的组合。它的核心分三层:
● 技能目录(browse.sh) - 268 个预研好的网站操作剧本,每个包含选择器、API 端点、请求参数、反爬策略
● Browse CLI(npm install -g browse) - 命令行入口,让 AI Agent 通过简单命令加载和运行技能
● Browserbase 云端浏览器 - 可选的后端,提供 CAPTCHA 自动破解、住宅代理、防检测浏览器
技能的执行方式有 6 种:API(99 个)、Browser(86 个)、Hybrid(32 个)、Fetch(25 个)、CLI(20 个)、MCP(6 个)。API 类技能直接调用网站的后端接口,最快最省;Browser 类技能需要启动浏览器模拟用户操作,适合交互复杂或 JS 渲染的页面。
关键数据 155 个技能已通过验证(verified),5 个来自官方合作方。每个技能都标注了推荐方法、是否需代理、来源 GitHub 地址和安装次数。
前置条件:你需要准备什么
Node.js 18+ - Browse CLI 是 Node 写的,需要先装 Node
Chrome 浏览器 - 本地模式需要 Chrome(macOS/Windows 下载即可,Linux 需 apt install)
API Key(可选) - 仅当需要云端浏览器时,去 browserbase.com/settings 申请
Claude Code(可选但推荐) - Browse.sh 深度集成 Claude Code 插件体系,一行命令添加
约 200MB 磁盘空间 - CLI + 依赖的安装大小
上手指南:5 分钟跑起来
第一步:安装 CLI
1 | npm install -g browse |
第二步:给 Claude Code 装插件
在 Claude Code 终端输入:
1 | /plugin marketplace add browserbase/skills |
然后重启 Claude Code。你也可以用 npx 方式直接装:
1 | npx skills add browserbase/skills |
第三步:试用一个技能
装好后你对 Claude 说一句话就行–它自己会调用 Browse CLI 干活:
“查一下明天北京到上海的高铁” → 自动加载 12306 技能 → 查时刻表 → 返回结果
“搜一下旧金山 5 月的 Airbnb,预算 200 美元以内” → 搜 Airbnb → 列清单
“帮我比比亚马逊上这双鞋的价格” → 调 Amazon 搜索技能 → 比价
“这个网页我打不开,帮我看看” → 启动 Browserbase 云端 → 截图回来
第四步:直接命令行操作
不想通过 AI 对话,也可以直接在终端用:
一些常用命令参考:
1 | browse open https://example.com |
避坑指南:实战中容易踩的雷
FIX常见问题
Chrome not found - CLI 默认找系统 Chrome。macOS 装了但报错?因为未放在标准路径。解决方案:用 browse open --auto-connect 附加已有 Chrome 实例,或者直接切 --remote 用云端。
No active page - 浏览器 Daemon 僵死了。跑 browse stop && pkill -f "browse.*daemon" 再重试。
反爬拦截 - 本地模式访问 Cloudflare 保护的网站可能返回空页面。切换 --remote 用 Browserbase 的自动 CAPTCHA 解决 + 住宅代理。
API Key 过期 - Browserbase 免费额度有限。先跑 browse status 检查连接状态,确认 API Key 是否有效。
本地开发(localhost) - 用 browse open http://localhost:3000 --local 打开本地服务,不要用远程模式访问本地地址。
这个项目为什么值得关注
AI Agent 的能力边界一直卡在”能读文字但不能操作网页”。OpenAI 的 Operator、Anthropic 的 computer use 都在解决这个问题,但它们的方案要么太贵(每次操作都要推理),要么太慢(”看”屏幕分析像素)。
Browse.sh 走了一条更务实的路:不靠 AI 推理来理解网页,而是提前把每个网站的操作方法研究好、打包好,Agent 直接调用。这就像给 AI 配了一本”网站操作手册”而不是让它每次到新地方都从头摸索。
它的好搭档 Stagehand(22.7k ⭐)提供浏览器自动化的底层 SDK,Browse.sh 在它之上建了一个操作层。再加上 Browserbase 的云端浏览器做 CAPTCHA 和代理–三层叠起来,一个 AI Agent 就能像真人一样操作几乎任何网站,而 token 消耗只有传统方案的 1/50。
Browserbase 的产品逻辑很清晰:核心能力(浏览器自动化)收费,外围工具(技能目录)开源。268 个技能只是开始–社区可以提交新技能,贡献者越多,目录越全,对 Browserbase 的生态反哺越强。这是一笔聪明的账。
SOURCES
Browse.sh 官网 - browse.sh
Browserbase Skills GitHub - github.com/browserbase/skills
Browserbase 官方 X 公告 - x.com/browserbase/status/2056404332824944970
Stagehand GitHub - github.com/browserbase/stagehand
💬 本文评论区已开启,但暂无读者留言。
本文转载自微信公众号,如有侵权请联系删除。
- 标题: Browse.sh:给 AI Agent 装上「万能浏览器技能包」,268 个网站的自动化剧本直接拿
- 作者: lxiol
- 创建于 : 2026-05-22 21:48:35
- 更新于 : 2026-05-22 21:48:35
- 链接: https://blog.lxiol.cn/2026/05/22/Browsesh给-AI-Agent-装上万能浏览器技能包268-个网站的自动化剧本直接拿/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。