browser-use
面向复杂网页任务和技能化工序的浏览器自动化 Agent。
开源
适合 Agent 需要执行复杂多步浏览器任务——表单填写、数据提取、Web 应用导航——通过自然语言指令而非脆弱脚本的场景。
选型建议
当 Agent 需要像人类一样导航复杂的动态 Web 应用时选 browser-use——带托管浏览器基础设施以保证生产可靠性。
适用场景
- 浏览器 Agent
- 网页自动化
- 复杂网页任务
- 技能化工序
不适用场景
- 用静态选择器就能完成的简单网页抓取
- 只需要 Playwright 级别脚本的团队
核心概念
browser agentsweb automationnatural languagecloud browsersskills
最小实现形态
给 browser-use 一个自然语言任务,如'登录 dashboard、提取月度报告、下载 CSV',让 Agent 执行多步工序。