agent-browser-core

🌐 AI原生浏览器自动化中枢

下载技能Zip包

51 次

🥥51

总安装量 14

评分人数 20

100% 的用户推荐

OpenClaw官方出品的浏览器自动化指南，基于Rust/Node.js双引擎CLI，为AI Agent提供确定性网页操作与结构化快照能力。

存在边界风险，建议在隔离环境中验证

来自可信组织或认证账号，需要结合权限范围判断
✅ Skill本身为纯文档型，无可执行代码、无网络请求、无文件操作
✅ 包含完善的安全指南文档（agent-browser-safety.md），明确列出高危功能与防护策略
⚠️ 所描述的agent-browser CLI为高风险外部工具，具备执行任意JS、文件访问、网络操控等能力
⚠️ 文档中描述了`eval`、`、`--allow-file-access`等高危功能的使用方法（虽伴有明确警告）
✅ 强调权限最小化原则：域名白名单、禁止localhost/私有网络、凭证脱敏等最佳实践

了解 BSS 安全性认证标准 >zip · 4.7 kB

使用说明

核心用法

agent-browser-core 是一套面向AI Agent的浏览器自动化操作指南，基于 agent-browser CLI工具（Rust核心+Node.js降级方案）。其核心工作流遵循"快照-引用-再快照"模式：首先捕获页面DOM快照生成带refs标记的结构化数据，AI通过refs定位元素执行点击、输入等操作，DOM变更后重新快照验证状态。所有操作支持 --json 输出便于机器解析，内置等待策略与加载状态检测确保操作可靠性。

显著优点

1. AI原生设计：专为LLM优化的快照格式，元素自带语义化refs引用，避免脆弱的CSS选择器
2. 双引擎保障：Rust核心保证性能，Node.js降级确保兼容性
3. 确定性输出：结构化JSON响应，适合自动化脚本集成
4. 完善的安全框架：内置安全模式、域名白名单、高危操作清单等防护机制
5. 生产级文档：涵盖安装、架构、命令映射、工作流、故障排查全链路

潜在缺点与局限性

非SDK形态：仅提供CLI调用指南，无法深度嵌入自定义JS代码
媒体流限制：不支持大文件上传流或复杂媒体工作流
外部依赖重：实际功能完全依赖用户自行安装的agent-browser CLI
学习成本：refs抽象概念需要理解，与传统Playwright/Selenium范式不同

适合的目标群体

构建AI Agent平台的开发者，需要机器可解析的浏览器交互接口
追求确定性、可审计的自动化测试团队
希望用Rust性能替代Node.js Puppeteer场景的基础设施工程师
需要结构化页面快照进行LLM推理的RAG应用开发者

使用风险

1. 供应链风险：agent-browser CLI通过npm分发，需固定版本防止恶意更新
2. 权限扩散：CLI本身具备执行任意JS、文件系统访问、网络流量操控等高权限，建议在Docker隔离环境运行
3. 凭证泄露：自动化流程中可能接触登录态，需确保日志脱敏与令牌管理
4. 资源泄漏：未关闭的tab或session会导致浏览器进程堆积，需严格遵循清理规范

automation development-engineering api testing backend devops

agent-browser-core 内容

references文件夹

手动下载zip · 4.7 kB

agent-browser-command-map.mdtext/markdown

请选择文件