agent browser 和 playwright-cli 区别?
· 5 min read
agent-browser 和 Playwright CLI 的区别不在"谁更好",而在谁在做决策——是 LLM 自己看着办,还是人写好每一步指令。
- agent-browser 目标驱动:给自然语言目标,LLM 自己规划并执行
- Playwright CLI 步骤驱动:open → click → fill,每一步都得人写清楚
- agent-browser 用 Accessibility Tree + @ref,Token 仅为完整 DOM 的 5%
- Playwright CLI 交互结果写磁盘,Agent 按需读,Token 比 MCP 方案省更多
- agent-browser 直连 CDP 复用登录会话;Playwright CLI 默认隔离上下文
- 容错逻辑相反:agent-browser LLM 语义兜底,Playwright CLI ref 变就挂
- 两条路都能走,走反了就是纯烧 Token

