10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI编程开发

Playwright MCP:让AI帮你完成所有浏览器自动化,两步搞定网页截图

4月前 AI编程开发 1366 0

最近我在研究各种MCP(Model Context Protocol)相关的工具,前面也写过一篇文章介绍了 Claude Code 与 Supabase 的结合用法,探索如何用 AI 自动化数据库交互。而 Playwright MCP 这套方案,则完全刷新了我对“AI自动化”的理解 —— 不再写代码,只用自然语言和结构化命令,就能让 AI 接管整个浏览器流程。

这篇文章,我就用亲测的方式,手把手带你了解什么是 Playwright MCP,如何快速上手做一套“AI网页自动化”,并顺带演示一个网页截图的工作流,真正体验一下“只会说人话也能写脚本”的新时代。

什么是 Playwright MCP?

Playwright MCP 是微软推出的一个全新协议,它结合了:

  • Playwright 浏览器自动化框架

  • 结构化快照系统(替代传统的 DOM/CSS 定位)

  • LLM 大模型(如 GPT、Claude)对自然语言指令的理解能力

换句话说,它是专为 AI 打造的浏览器控制协议 —— 不需要写 XPath、不需要找选择器,AI 就能听你说话去点击、跳转、截图、提取内容、生成测试脚本。

为什么值得用?

对比维度 Selenium Playwright MCP
操作方式 选择器 + 手写代码 自然语言 + 快照结构
编码门槛 高 超低,零代码
适应性 易崩,页面一改就挂 自动适应 DOM 结构变更
跨设备 支持有限 支持移动、平板模拟器
性能 一般 快 30~50%

最关键的是:你可以把 Playwright MCP 当作一个 AI 助手,告诉它“帮我截图”、“点击右上角登录按钮”,它就真能听懂去做。

支持的常用命令

Playwright MCP 提供了非常完整的一套浏览器操作能力,下面我按模块简单列一下:

浏览器控制

  • browser_close():关闭浏览器

  • browser_resize():调整窗口或切换为手机模式

  • browser_install():下载对应浏览器内核(如Chromium)

页面交互

  • browser_click():点击按钮

  • browser_type():输入内容

  • browser_hover():悬停

  • browser_drag():拖拽元素

  • browser_select_option():选择下拉菜单项

导航和标签页

  • browser_navigate():跳转网址

  • browser_tab_new() / browser_tab_select() / browser_tab_close():多标签控制

  • browser_navigate_back() / browser_navigate_forward():前进/后退操作

数据提取与截图

  • browser_snapshot():结构化快照,AI用来理解页面结构

  • browser_take_screenshot():网页截图

  • browser_pdf_save():另存为 PDF

  • browser_file_upload():上传文件

调试&高级操作

  • browser_console_messages():获取 console 输出

  • browser_handle_dialog():自动处理弹窗

  • browser_network_requests():查看网络请求

  • browser_generate_playwright_test():生成测试代码!

如何安装和使用?

常用的IDE配置方法,及如何快速使用

方式一:VScode + npx 快速配置

在 .mcp/config.json 中加入:

"playwright": {
"command": "npx",
"args": ["-y", "@playwright/mcp@latest"]
}

方式二:在 Cursor 中一键添加

Cursor 支持原生 MCP 插件,在 Tools 菜单直接点击添加:

Add Playwright to Cursor

方式三:在 Trae 中使用

Trae MCP 市场中搜索“playwright”,点击添加即可,非常简单

对话时选择 Builder with MCP,接着发送需求就可以了

接下来playwright MCP就会执行任务了

方式四:在 Cherry 中使用

还是可以当作日常工具使用,配置在Cherry上,可以通过对话实现一些简单的自动化功能

添加MCP配置,参考上面的配置文件,只需要添加一个npx + 两行命令就搞定了

接着在对话框选择playwright MCP,让它告诉你都能做什么

实测最简单的网页截图,Cherry会调用系统默认浏览器执行操作:

而且还是截取的全屏

结语:MCP + AI = 自动化新范式

Playwright MCP不是另一个低代码平台,而是真正让“语言模型接管网页”的落地方案。你不再需要学习 JavaScript,也不再需要反复调试 selector,只需要说出你要什么,AI 就能完成任务。

我自己也在把它集成进 Claude Code 的 Agent 流程中,未来可能构建一套「AI+Browser」的内容抓取自动工具。

项目地址:https://github.com/microsoft/playwright

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Playwright MCP:让AI帮你完成所有浏览器自动化,两步搞定网页截图
#MCP #Playwright #浏览器自动化 #网页截图 
收藏 1
手把手教你开通 ChatGPT & Claude,无需信用卡,5 分钟搞定(100% 合规)
手把手教你用Fish Audio实现文本转语音、声音克隆与故事对话播客
推荐阅读
  • 深度解析Cursor 0.5版本的 @folders 命令:提升代码开发效率的必备技能
  • 深入解析Cursor的安全性与功能:官方安全文档中披露的代码检索逻辑
  • 教程|三分钟把豆包 Doubao-Seed-Code 接入 Claude Code,全流程实操指南
  • Claude Code Chat:一款VS Code的插件,让 Claude Code 秒变IDE的最佳方案
  • MCP数据库实战:用Cherry Studio+MCP轻松访问本地数据库,让AI秒变数据库专家
评论 (0)
请登录后发表评论
分类精选
手把手教你用支付宝订阅 Cursor Pro:国内用户最全开通教程(附取消自动扣费)
17157 6月前
Claude Code Rules:claude.md文件配置完全指南
12105 5月前
学生党0元白嫖!手把手教你解锁Cursor Pro年VIP,超详细申请教程(附避坑指南)
12059 7月前
Cursor 0.46更新,新增支持Claude 3.7 + GPT 4.5,Cursor Pro 无限续杯攻略,全自动化工具使用说明
11823 9月前
Claude Code 官方已支持Windows系统!手把手教你免费安装使用Claude Code
11015 5月前
Claude Code + MCP 实战教程:手把手教你如何在Claude Code里面使用MCP
10689 5月前
Cursor代码生成器中文使用教程,Cursor新手入门完全指南,全网最全面详细的Cursor使用教程
10349 12月前
手把手教你在VS Code & Cline/RooCode 中使用Kimi K2 模型,配置实录+开发实战体验
8083 5月前
手把手教你在Claude Code 中使用Kimi K2 模型,超简单配置教程分享
7947 5月前
Cursor新手3分钟快速搞懂 Ask/Manual/Agent 三种模式及高级技巧
7469 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Claude Code CLI更新 2.0.64:新增异步子代理、即时压缩、自定义会话名和使用统计
2 为Claude Code构建Skills:如何通过模块化知识包实现组织记忆自动化
3 mcp-memory-service:Claude Code每次都失忆?这个开源工具帮你彻底解决记忆问题
4 远程使用Claude Code的三种方案对比与实践总结
5 ACE:最强上下文引擎 Augment Context Engine,已支持主流的 AI 工具进行集成
6 Claude Agent:长时间运行AI代理编码指南,适用于长期运行 Agents 的有效框架
7 Claude-Mem:通过持久内存压缩系统,让 Claude 真正记住并复用长期上下文
8 cc-switch:Claude Code 环境变量快速切换工具
9 Claude用不起?最强平替 GLM-4.6 全平台编程开发接入实战教程
10 黑五特惠GLM-4.6,教你如何配置 Claude Code 套餐的图像分析、视频理解、联网搜索等MCP
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联