目录

不是 AI 不会上网,是你没给它装"手"

/images/给AI装只手-封面.png

干审计、干财务的,天天都绕不开几件"必须开浏览器"的活儿。

查法规,几百页的法条一页页翻;查工商,一家家点进去下附件;客户 ERP 系统在浏览器里,想批量导点数据、下点附件,还得手动一个个点。

这些活儿,问 AI 它都干不了——它会回答你,可它上不了网。

但真的是它干不了吗?

不是 AI 不行,是你没给它装工具

这是我课程里反复说的一句话,也是这一节的主线。

AI 默认确实不会上网,就像它默认看不了 PDF、看不了图片一样。但你给它装上对应的工具,它就能干。

想让 AI 干什么 默认会吗 装什么
识别 PDF、发票、合同 MinerU
看图(让纯文本模型识图) Vision MCP
操作浏览器 Playwright

这套逻辑一旦建立起来,你会发现"AI 干不了某件事"的绝大多数情况,根子都不在 AI,而在你手上有没有那个工具。

以前这种活儿怎么干?写爬虫

难点不在于活儿本身,在于以前处理这种活儿唯一的办法是写爬虫

要会 Python,要研究网站结构,碰到登录、验证码、滑块还得想办法绕。门槛不低,大多数人就直接放弃了,老老实实手动点。

现在不一样了。有了 AI,我们不需要一个个去写爬虫——让 AI 自己去操作浏览器就行。

两条路线,先记住一条心法

让 AI 操作浏览器,有两种做法,差别很大。

路线一:AI 实时操控浏览器。它真的去控制鼠标键盘,像真人一样点页面。适合反爬严、要登录扫码、有验证码的场景。缺点是慢、费 token。

路线二:AI 跑通一次,固化成脚本。AI 还是去操作浏览器,但只操作这一次,目的是分析页面背后到底请求了哪些接口。然后把这些请求写成脚本,以后再抓直接跑脚本,不用再开浏览器。

/images/给AI装只手-认知图.png

心法就一句:先让 AI 帮你跑通,再固化为确定性的、快的脚本。

能用路线二就用路线二——快、稳、便宜、可批量。只有遇到严格的反爬和登录,才动用路线一。

一句话,让 AI 自己装

具体用什么工具?Playwright。它本来是程序员用来自动化测试网页的,现在我们拿过来给 AI 用。

你不用懂技术细节,把下面这句话复制粘贴给 AI(OpenCode、Claude Code 都行):

请帮我安装 Playwright MCP 和 Playwright cli,我后面要用来操作浏览器,浏览器可以提示直接使用我电脑已安装的浏览器。

就这一句。AI 会自己检查环境、安装、检测你电脑里有没有可用的浏览器,最后还会自己打开浏览器又关上,验证能不能调用。

整个过程,你一行命令都不用敲。

一个坑:别让它在线硬下浏览器

有一个坑提前说,能帮你省十几分钟。

Playwright 默认会去下载一个 Chromium(轻量版谷歌浏览器),问题是这个下载依赖网络,国内经常下不动,卡在那儿十几分钟甚至失败。

解决办法就一条:先复用你电脑已有的浏览器。Windows 自带的 Edge(它是 Chromium 内核,Playwright 直接能用),或者你装的 Chrome,能用就直接用,别让它下。

指令里那句"使用我电脑已安装的浏览器"就是干这个的。AI 检测到 Edge 能用,就不再去下了。

实在没有,课程网盘里我也放了 Chromium,提前下好,别让它在线熬。

装上,它就都能干

最后回到那条认知。

不是 AI 不行,是你没给它装工具。

识 PDF 装 MinerU,识图装 Vision MCP,操作浏览器装 Playwright。你要做的,就是知道"有这种工具存在",然后一句话让 AI 帮你装上。

装好,它就都能干。

今天还录了一节课,教大家用 AI 操作浏览器,完成国家法律法规库和规章库的查询 skill 的制作——把"查法规"这件每个审计人都绕不开的活儿,固化成 AI 随时能调用的工具。这节是上面这套思路的实战应用,感兴趣的同学可以跟着课程一起做出来。

课程网址(点击“阅读原文”):

https://m.tenclass.cn/channel2/1880290

购买后,加助理,发送购买截图,加入答疑群:

/images/Pasted-image-20260616233302.png