最近在用Claude Code的过程中,发现了几个设计思路各不相同的开源扩展工具。
它们分别针对工作流碎片化、上下文管理透明度和浏览器交互自动化三个具体痛点。
今天想把这些工具的设计思路和实际应用场景梳理一下,供大家参考。
一、WaveTerm:统一工作界面的终端解决方案
核心定位
WaveTerm是一个多窗口合并终端,核心能力是在单一界面内整合终端、文件编辑、文件预览和网页浏览。项目在GitHub上已获得1.8万+Stars。

功能特性
分块布局系统:界面采用可自由拖拽的分块设计,每个块可独立配置为:
- 终端窗口(运行命令行操作)
- 编辑器(编写和修改代码)
- 文件预览(Markdown、图片、PDF、视频、CSV等格式原生渲染)
- 网页浏览(查阅文档和参考资源)
- AI聊天窗口(集成Claude对话)
文件格式支持广度:直接在终端内渲染多种文件格式,无需切换应用。

应用场景
适合Claude Code的高频使用者。典型工作流:
- 左侧运行Claude Code生成代码
- 右侧实时预览Markdown格式的项目计划
- 下方集成浏览器查看API文档
- 终端窗口执行构建和测试命令
相比频繁切换应用窗口,这种集成方式能减少上下文切换的认知成本。
安装部署
macOS用户可通过Homebrew一行安装:
brew install --cask waveterm
Linux和Windows用户可从官方GitHub Release下载对应版本。
项目信息
开源地址:https://github.com/wavetermdev/waveterm
二、Claude HUD:运行时状态透明化插件
核心定位
Claude HUD是Claude Code的实时监控插件,在输入行下方添加状态栏,让用户实时掌握Claude的执行状态。GitHub上5千+Stars。

功能特性
上下文窗口监控(关键特性):
- 实时进度条显示Token消耗情况
- 绿-黄-红三阶段视觉反馈
- 绿色:安全范围;黄色:警告阈值;红色:接近限制
工具调用追踪:显示Claude的操作统计,如"Read x3 | Edit x1",清晰指示当前的文件读写动作。
Agent执行监控(多任务场景):
- 后台并行任务的实时进度显示(如"3/5")
- 每个Agent的运行时长统计
- 当前执行任务的标记
应用价值
解决的是可见性问题而非功能问题。但实际使用中,上下文窗口的进度条避免了"Claude开始胡说八道"这一常见问题——用户能提前意识到Token即将耗尽,及时采取措施(如清空历史、分割任务)。

安装部署
通过Claude Code的插件市场安装:
/plugin marketplace add jarrodwatts/claude-hud /plugin install claude-hud/claude-hud:setup
安装后无需重启,立即生效。
项目信息
开源地址:https://github.com/jarrodwatts/claude-hud
三、chrome-cdp-skill:浏览器自动化的Skill扩展
核心定位
chrome-cdp-skill通过Chrome DevTools Protocol(CDP)直接连接本地Chrome浏览器,让Claude Code能直接操控用户当前打开的浏览器窗口。项目发布4天内已突破2千+Stars,反映出实际需求的迫切性。

技术架构
轻量级守护进程模型:
- 每个浏览器标签页创建一个独立守护进程
- 调试授权弹窗仅在首次弹出,后续自动复用已授权状态
- 支持100+标签页场景而不会崩溃
- 守护进程在20分钟无活动后自动退出,避免资源泄漏
功能范围
覆盖主要的浏览器交互场景:
- 页面截图(用于验证渲染结果)
- DOM结构获取(用于页面分析)
- 元素点击(模拟用户交互)
- 文本输入(填充表单字段)
- 页面导航(切换URL)

应用场景
自动化工作流:
- 网页内容的自动化抓取和处理
- 表单的批量填充和提交
- 前端自动化测试辅助
- 需要人工审核的流程中实现半自动化
与相关工具的对比:
| 工具/方案 | 连接方式 | 资源开销 | 适用场景 |
|---|---|---|---|
| chrome-cdp-skill | 直连现有浏览器进程 | 轻量(守护进程) | 已有浏览器窗口,需快速自动化 |
| Puppeteer/Playwright | 启动独立浏览器实例 | 较重(完整浏览器进程) | 独立自动化任务、批量处理 |
| Selenium | WebDriver协议 | 中等 | 复杂测试场景、多浏览器兼容性 |
安装配置
第一步:在Chrome中启用远程调试
chrome://inspect/#remote-debugging
(此时Chrome会在本地监听CDP端口,通常为9222)
第二步:获取Skill文件
从GitHub仓库下载或克隆chrome-cdp-skill项目。
第三步:部署到Claude Code
将skill文件放入Claude Code的skills目录。具体路径取决于Claude Code的安装位置和配置。
第四步:在Claude Code中调用
通过提示词触发浏览器操作指令,Claude会自动调用对应的skill。
项目信息
开源地址:https://github.com/pasky/chrome-cdp-skill
工具选型对标表
| 维度 | WaveTerm | Claude HUD | chrome-cdp-skill |
|---|---|---|---|
| 解决的问题 | 窗口碎片化 | 运行状态不透明 | 浏览器交互自动化 |
| 使用复杂度 | 低(安装即用) | 低(插件命令) | 中等(需配置Chrome) |
| 性能影响 | 中等(新应用进程) | 极小(插件轻量) | 轻量(守护进程) |
| 关键用户 | Claude Code高频使用者 | 处理大型任务的用户 | 需要网页自动化的场景 |
总结
这三个工具的设计思路反映了Claude Code生态的不同需求方向:
- WaveTerm直指工作环境的碎片化问题,提供了一个整合的工作界面。如果你每天都在终端、编辑器、浏览器间频繁切换,这个工具能切实减少认知开销。
- Claude HUD做的是"看见"——让Claude的执行过程可观测。尤其是上下文窗口的进度条,这个功能虽然简单,但在处理长流程任务时能预防很多问题。
- chrome-cdp-skill则扩展了Claude Code的能力边界,让AI能直接操作用户的浏览器。这开启了很多原本需要手工或复杂脚本才能完成的自动化场景。
这三个项目虽然各自独立,但组合使用会形成较完整的增强方案。特别是对于需要在Claude Code中处理复杂、长流程任务的用户而言,同时引入这三个工具能显著提升开发体验的完整度。
开源社区对Claude Code的适配速度远超预期,这说明AI代码生成工具已经进入了"工程化"阶段,开始需要专业级的配套工具链来支撑实际工作流。