10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI编程开发

Playwright MCP:让AI帮你完成所有浏览器自动化,两步搞定网页截图

18小时前 AI编程开发 71 0

最近我在研究各种MCP(Model Context Protocol)相关的工具,前面也写过一篇文章介绍了 Claude Code 与 Supabase 的结合用法,探索如何用 AI 自动化数据库交互。而 Playwright MCP 这套方案,则完全刷新了我对“AI自动化”的理解 —— 不再写代码,只用自然语言和结构化命令,就能让 AI 接管整个浏览器流程。

这篇文章,我就用亲测的方式,手把手带你了解什么是 Playwright MCP,如何快速上手做一套“AI网页自动化”,并顺带演示一个网页截图的工作流,真正体验一下“只会说人话也能写脚本”的新时代。

什么是 Playwright MCP?

Playwright MCP 是微软推出的一个全新协议,它结合了:

  • Playwright 浏览器自动化框架

  • 结构化快照系统(替代传统的 DOM/CSS 定位)

  • LLM 大模型(如 GPT、Claude)对自然语言指令的理解能力

换句话说,它是专为 AI 打造的浏览器控制协议 —— 不需要写 XPath、不需要找选择器,AI 就能听你说话去点击、跳转、截图、提取内容、生成测试脚本。

为什么值得用?

对比维度 Selenium Playwright MCP
操作方式 选择器 + 手写代码 自然语言 + 快照结构
编码门槛 高 超低,零代码
适应性 易崩,页面一改就挂 自动适应 DOM 结构变更
跨设备 支持有限 支持移动、平板模拟器
性能 一般 快 30~50%

最关键的是:你可以把 Playwright MCP 当作一个 AI 助手,告诉它“帮我截图”、“点击右上角登录按钮”,它就真能听懂去做。

支持的常用命令

Playwright MCP 提供了非常完整的一套浏览器操作能力,下面我按模块简单列一下:

浏览器控制

  • browser_close():关闭浏览器

  • browser_resize():调整窗口或切换为手机模式

  • browser_install():下载对应浏览器内核(如Chromium)

页面交互

  • browser_click():点击按钮

  • browser_type():输入内容

  • browser_hover():悬停

  • browser_drag():拖拽元素

  • browser_select_option():选择下拉菜单项

导航和标签页

  • browser_navigate():跳转网址

  • browser_tab_new() / browser_tab_select() / browser_tab_close():多标签控制

  • browser_navigate_back() / browser_navigate_forward():前进/后退操作

数据提取与截图

  • browser_snapshot():结构化快照,AI用来理解页面结构

  • browser_take_screenshot():网页截图

  • browser_pdf_save():另存为 PDF

  • browser_file_upload():上传文件

调试&高级操作

  • browser_console_messages():获取 console 输出

  • browser_handle_dialog():自动处理弹窗

  • browser_network_requests():查看网络请求

  • browser_generate_playwright_test():生成测试代码!

如何安装和使用?

常用的IDE配置方法,及如何快速使用

方式一:VScode + npx 快速配置

在 .mcp/config.json 中加入:

"playwright": {
"command": "npx",
"args": ["-y", "@playwright/mcp@latest"]
}

方式二:在 Cursor 中一键添加

Cursor 支持原生 MCP 插件,在 Tools 菜单直接点击添加:

Add Playwright to Cursor

方式三:在 Trae 中使用

Trae MCP 市场中搜索“playwright”,点击添加即可,非常简单

对话时选择 Builder with MCP,接着发送需求就可以了

接下来playwright MCP就会执行任务了

方式四:在 Cherry 中使用

还是可以当作日常工具使用,配置在Cherry上,可以通过对话实现一些简单的自动化功能

添加MCP配置,参考上面的配置文件,只需要添加一个npx + 两行命令就搞定了

接着在对话框选择playwright MCP,让它告诉你都能做什么

实测最简单的网页截图,Cherry会调用系统默认浏览器执行操作:

而且还是截取的全屏

结语:MCP + AI = 自动化新范式

Playwright MCP不是另一个低代码平台,而是真正让“语言模型接管网页”的落地方案。你不再需要学习 JavaScript,也不再需要反复调试 selector,只需要说出你要什么,AI 就能完成任务。

我自己也在把它集成进 Claude Code 的 Agent 流程中,未来可能构建一套「AI+Browser」的内容抓取自动工具。

项目地址:https://github.com/microsoft/playwright

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Playwright MCP:让AI帮你完成所有浏览器自动化,两步搞定网页截图
#MCP #Playwright #浏览器自动化 #网页截图 
收藏 1
手把手教你开通 ChatGPT & Claude,无需信用卡,5 分钟搞定(100% 合规)
产品经理的新挑战:Vibe Coding成为产品经理进入AI时代的必修课
推荐阅读
  • Cursor Project Rules 进阶指南:从规则到工程化思维,Project Rules 实战技巧与模板分享
  • Cursor代码生成器中文使用教程,Cursor新手入门完全指南,全网最全面详细的Cursor使用教程
  • MCP数据库实战:用Cherry Studio+MCP轻松访问本地数据库,让AI秒变数据库专家
  • Claude Code 官方已支持Windows系统!手把手教你免费安装使用Claude Code
  • Cursor新手3分钟快速搞懂 Ask/Manual/Agent 三种模式及高级技巧
评论 (0)
请登录后发表评论
分类精选
Cursor 0.46更新,新增支持Claude 3.7 + GPT 4.5,Cursor Pro 无限续杯攻略,全自动化工具使用说明
9565 5月前
学生党0元白嫖!手把手教你解锁Cursor Pro年VIP,超详细申请教程(附避坑指南)
8892 2月前
Cursor代码生成器中文使用教程,Cursor新手入门完全指南,全网最全面详细的Cursor使用教程
7677 7月前
Claude Code 官方已支持Windows系统!手把手教你免费安装使用Claude Code
5772 2周前
深入解析Cursor的安全性与功能:官方安全文档中披露的代码检索逻辑
4984 7月前
手把手教你用支付宝订阅 Cursor Pro:国内用户最全开通教程(附取消自动扣费)
4572 1月前
用 Cursor 搭配 Context7,让 AI 自动看文档、写对代码的神级MCP插件
3878 1月前
手把手教你上手Cursor安装使用,搭配神级Prompt(Thinking Claude),零基础实战开发谷歌插件小游戏
3765 7月前
Cursor新手3分钟快速搞懂 Ask/Manual/Agent 三种模式及高级技巧
3696 2月前
手把手教你在Claude Code 中使用Kimi K2 模型,超简单配置教程分享
3449 2周前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Claude Code Remote:这个开源项目让我实现了远程控制Claude Code
2 Playwright MCP:让AI帮你完成所有浏览器自动化,两步搞定网页截图
3 CCCS:快速切换 Claude Code 配置文件,一键切换不同的 Claude Code API
4 解构Sub Agents:AI规范驱动开发,让你的Claude Code不止是编程助手!
5 Claude Code 原版使用指南+五大平替方案
6 一文掌握Claude Code使用全指南,从安装到订阅的Claude Code使用教程
7 先别急着卸载Cursor,看完Cursor变废为宝小技巧再考虑要不要留下!
8 从Cursor到Claude Code:避坑4大难题,我的高效开发迁移指南
9 GitHub-MCP-Server:开发必备自动化 AI 助手,从部署到实战
10 15个Claude Code进阶技巧,迅速颠覆你的开发效率(附提示词)
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
程序库 免费影视APP 花式玩客 免费字体下载 产品经理导航 Axure RP 10 免费Axure模板 Axure原型设计 Axure元件库下载 申请友联