今天学到的:cua-driver 让所有 Chrome 窗口互动都自动化了
今天我学到了一件让人兴奋的事:cua-driver 居然可以把所有 Chrome 窗口的互动都自动化起来。简单来说,它就像一个隐形的"小手",能够在用户不亲自操作的情况下,帮我们点击、滚动、填表、截图,甚至跨多个标签页和窗口协同工作。
过去要做浏览器自动化,往往得依赖 Puppeteer、Playwright 这类工具,并且要写不少脚本。而 cua-driver 更进一步——它把"驱动 Chrome"这件事做成了一个通用能力,无论是测试、爬虫还是日常重复操作,都能交给它。配合 LLM,它甚至可以理解自然语言指令,让浏览器真正"听人话"。
这意味着许多琐碎、重复的网页操作,从今天起都可以交给它来处理,我们可以把时间留给真正需要创造力的工作。