我发现Claude Code虽然自带了基础的联网功能,但在实际应用中存在明显的局限性——缺乏调度策略、无法处理动态内容、对需要登录态的页面更是无能为力。
直到接触到Web Access这个开源项目,我意识到这正是填补Claude Code能力空白的关键工具。今天就来详细介绍一下这个项目的核心能力和实际应用价值。
项目概览
Web Access是一个为Claude Code设计的浏览器自动化扩展插件,核心定位是为AI Agent提供完整的网页交互能力。

相比Claude Code原生的联网工具,Web Access通过引入三层通道调度机制和CDP浏览器协议直连,使AI能够像真实用户一样浏览网页、填写表单、上传文件,甚至处理需要登录认证的复杂场景。

项目目前在GitHub上获得了2.1k Stars和168个Forks,采用MIT开源协议,作者为eze-is,最新版本为v2.4。
核心功能分析
1. 联网工具智能选择
Web Access内置了多种网页获取方案,能够根据不同场景自动判断最优工具:
- 静态页面优先使用Jina等轻量级方案
- 动态内容切换到CDP Proxy进行浏览器操作
- 特定场景则调用专有工具处理
这种自适应机制避免了"一把锤子敲所有钉子"的低效做法。
2. Chrome DevTools Protocol(CDP)代理层
这是Web Access的技术核心。它通过WebSocket直接连接到本地Chrome浏览器,无需复杂的命令行配置,即可通过HTTP API进行页面操作。支持的操作包括:
- 新建标签页:
curl -s "http://localhost:3456/new?url=https://example.com" - JavaScript执行:
curl -s -X POST "http://localhost:3456/eval?target=ID" -d 'document.title' - 点击操作:支持模拟点击(click)和真实鼠标事件(clickAt)
- 文件上传:
curl -s -X POST "http://localhost:3456/setFiles?target=ID" -d '{"selector":"input[type=file]","files":["/path/to/file.png"]}' - 页面截图与滚动:
curl -s "http://localhost:3456/screenshot?target=ID&file=/tmp/shot.png" - 标签页管理:关闭、切换等操作
这套API设计相对简洁,降低了AI Agent的调用成本。
3. 并行任务分治
当需要同时处理多个目标网站时,Web Access可以创建多个子Agent并行执行。这些子Agent共享同一个CDP Proxy,但在标签页级别完全隔离。实际应用中,可以让AI同时调研5个竞品官网并生成对比分析,系统会自动创建5个并行子任务,最后汇总结果。
4. 站点经验积累机制
Web Access按域名存储操作经验,包括:
- URL结构规律和路由模式
- 特定HTTP Header或Cookie需求
- 页面加载特性(如需要滚动才能加载完整内容的陷阱)
- 站点特有的交互逻辑
这些经验可以跨Session复用,避免重复踩坑。特别是对于频繁访问的网站,经验库会不断积累,提高后续操作的成功率。
5. 媒体提取能力
支持从DOM直接提取图片和视频URL,或对视频的任意时间点进行截帧分析,适合需要进行视觉内容处理的场景。
6. 站点特化处理
项目对小红书等重点站点做了深度优化,包括xsec_token机制处理、创作者平台状态校验和暂存草稿流程等,这些细节大幅提升了实际应用的可靠性。
安装与部署
环境要求:
- Node.js版本22及以上
- Chrome浏览器已启用远程调试
启用Chrome远程调试:
在Chrome地址栏打开 chrome://inspect/#remote-debugging,勾选"Allow remote debugging for this browser instance",必要时重启浏览器。
环境检查:
bash ~/.claude/skills/web-access/scripts/check-deps.sh
安装方式有两种:
方式一(自动安装):
在Claude中输入:帮我安装这个 skill:https://github.com/eze-is/web-access
方式二(手动安装):git clone https://github.com/eze-is/web-access ~/.claude/skills/web-access
启动CDP Proxy服务:
node ~/.claude/skills/web-access/scripts/cdp-proxy.mjs &
典型应用场景
场景一:信息搜索与汇总
用户:帮我搜索最近AI Agent的进展
系统:自动选择WebSearch工具检索信息,并生成结构化总结
场景二:页面内容阅读
用户:读一下这个页面的内容:https://example.com/article
系统:选择合适的工具获取完整内容并进行摘要
场景三:需要登录态的操作
用户:去小红书搜索某账号并提取其内容
系统:使用CDP Proxy打开携带用户登录态的Chrome,执行搜索、提取数据
场景四:自动化内容发布
用户:帮我在创作者平台发布一篇图文
系统:操作浏览器登录平台、上传图片、编辑内容、完成发布流程
场景五:并行竞品分析
用户:同时访问这5个竞品官网并给出对比分析
系统:并行创建5个子任务,各自访问目标网站、提取关键信息、最后进行对比输出
与同类项目的对比
目前市场上也有其他网页自动化解决方案,如Playwright、Puppeteer等。但Web Access的差异化在于:
| 维度 | Web Access | Playwright | Puppeteer |
|---|---|---|---|
| 集成度 | 原生集成Claude Code | 需要单独开发集成 | 需要单独开发集成 |
| 学习曲线 | AI自动调度,无需手动编程 | 需要编写脚本 | 需要编写脚本 |
| 登录态处理 | 直连本地Chrome,天然支持 | 需要手动cookie配置 | 需要手动cookie配置 |
| 并行调度 | 内置并行分治机制 | 需要自行实现 | 需要自行实现 |
| 经验复用 | 内置站点经验积累 | 无 | 无 |
设计理念
Web Access背后的核心哲学是"目标驱动而非步骤驱动"。项目不是简单地提供一本操作手册,而是通过清晰的决策逻辑,把选择权交给AI Agent:
- 优先级速度?使用轻量级方案
- 需要动态交互?切换到CDP Proxy
- 多个任务堆积?自动并行处理
这种设计使得系统在面对未知场景时,仍能保持相对的灵活性和自适应能力。
总结
Web Access本质上不是简单的工具堆砌,而是一套针对Claude Code的系统性增强方案。它通过调度策略、浏览器直连、经验积累等多个维度,让AI Agent能够处理真实网络环境中的复杂场景——从简单的页面爬取到复杂的登录态操作,从单网站处理到多网站并行分析。
特别值得关注的是其"站点经验积累"设计,这种跨Session的知识复用机制在同类产品中并不常见,代表了一种更务实的工程思路。
如果你正在使用Claude Code进行网页自动化工作,这个项目值得深入体验。