当前位置：首页 » AI编程开发

最近用的贼多的 3 个 Claude Code 开源宝藏：WaveTerm、Claude HUD、浏览器自动化

2小时前 AI编程开发 8 0

最近在用Claude Code的过程中，发现了几个设计思路各不相同的开源扩展工具。

它们分别针对工作流碎片化、上下文管理透明度和浏览器交互自动化三个具体痛点。

今天想把这些工具的设计思路和实际应用场景梳理一下，供大家参考。

一、WaveTerm：统一工作界面的终端解决方案

核心定位

WaveTerm是一个多窗口合并终端，核心能力是在单一界面内整合终端、文件编辑、文件预览和网页浏览。项目在GitHub上已获得1.8万+Stars。

功能特性

分块布局系统：界面采用可自由拖拽的分块设计，每个块可独立配置为：

终端窗口（运行命令行操作）
编辑器（编写和修改代码）
文件预览（Markdown、图片、PDF、视频、CSV等格式原生渲染）
网页浏览（查阅文档和参考资源）
AI聊天窗口（集成Claude对话）

文件格式支持广度：直接在终端内渲染多种文件格式，无需切换应用。

应用场景

适合Claude Code的高频使用者。典型工作流：

左侧运行Claude Code生成代码
右侧实时预览Markdown格式的项目计划
下方集成浏览器查看API文档
终端窗口执行构建和测试命令

相比频繁切换应用窗口，这种集成方式能减少上下文切换的认知成本。

安装部署

macOS用户可通过Homebrew一行安装：

brew install --cask waveterm

Linux和Windows用户可从官方GitHub Release下载对应版本。

项目信息

开源地址：https://github.com/wavetermdev/waveterm

二、Claude HUD：运行时状态透明化插件

核心定位

Claude HUD是Claude Code的实时监控插件，在输入行下方添加状态栏，让用户实时掌握Claude的执行状态。GitHub上5千+Stars。

功能特性

上下文窗口监控（关键特性）：

实时进度条显示Token消耗情况
绿-黄-红三阶段视觉反馈
绿色：安全范围；黄色：警告阈值；红色：接近限制

工具调用追踪：显示Claude的操作统计，如"Read x3 | Edit x1"，清晰指示当前的文件读写动作。

Agent执行监控（多任务场景）：

后台并行任务的实时进度显示（如"3/5"）
每个Agent的运行时长统计
当前执行任务的标记

应用价值

解决的是可见性问题而非功能问题。但实际使用中，上下文窗口的进度条避免了"Claude开始胡说八道"这一常见问题——用户能提前意识到Token即将耗尽，及时采取措施（如清空历史、分割任务）。

安装部署

通过Claude Code的插件市场安装：

/plugin marketplace add jarrodwatts/claude-hud
/plugin install claude-hud/claude-hud:setup

安装后无需重启，立即生效。

项目信息

开源地址：https://github.com/jarrodwatts/claude-hud

三、chrome-cdp-skill：浏览器自动化的Skill扩展

核心定位

chrome-cdp-skill通过Chrome DevTools Protocol（CDP）直接连接本地Chrome浏览器，让Claude Code能直接操控用户当前打开的浏览器窗口。项目发布4天内已突破2千+Stars，反映出实际需求的迫切性。

技术架构

轻量级守护进程模型：

每个浏览器标签页创建一个独立守护进程
调试授权弹窗仅在首次弹出，后续自动复用已授权状态
支持100+标签页场景而不会崩溃
守护进程在20分钟无活动后自动退出，避免资源泄漏

功能范围

覆盖主要的浏览器交互场景：

页面截图（用于验证渲染结果）
DOM结构获取（用于页面分析）
元素点击（模拟用户交互）
文本输入（填充表单字段）
页面导航（切换URL）

应用场景

自动化工作流：

网页内容的自动化抓取和处理
表单的批量填充和提交
前端自动化测试辅助
需要人工审核的流程中实现半自动化

与相关工具的对比：

工具/方案	连接方式	资源开销	适用场景
chrome-cdp-skill	直连现有浏览器进程	轻量（守护进程）	已有浏览器窗口，需快速自动化
Puppeteer/Playwright	启动独立浏览器实例	较重（完整浏览器进程）	独立自动化任务、批量处理
Selenium	WebDriver协议	中等	复杂测试场景、多浏览器兼容性

安装配置

第一步：在Chrome中启用远程调试

chrome://inspect/#remote-debugging

（此时Chrome会在本地监听CDP端口，通常为9222）

第二步：获取Skill文件

从GitHub仓库下载或克隆chrome-cdp-skill项目。

第三步：部署到Claude Code

将skill文件放入Claude Code的skills目录。具体路径取决于Claude Code的安装位置和配置。

第四步：在Claude Code中调用

通过提示词触发浏览器操作指令，Claude会自动调用对应的skill。

项目信息

开源地址：https://github.com/pasky/chrome-cdp-skill

工具选型对标表

维度	WaveTerm	Claude HUD	chrome-cdp-skill
解决的问题	窗口碎片化	运行状态不透明	浏览器交互自动化
使用复杂度	低（安装即用）	低（插件命令）	中等（需配置Chrome）
性能影响	中等（新应用进程）	极小（插件轻量）	轻量（守护进程）
关键用户	Claude Code高频使用者	处理大型任务的用户	需要网页自动化的场景

总结

这三个工具的设计思路反映了Claude Code生态的不同需求方向：

WaveTerm直指工作环境的碎片化问题，提供了一个整合的工作界面。如果你每天都在终端、编辑器、浏览器间频繁切换，这个工具能切实减少认知开销。
Claude HUD做的是"看见"——让Claude的执行过程可观测。尤其是上下文窗口的进度条，这个功能虽然简单，但在处理长流程任务时能预防很多问题。
chrome-cdp-skill则扩展了Claude Code的能力边界，让AI能直接操作用户的浏览器。这开启了很多原本需要手工或复杂脚本才能完成的自动化场景。

这三个项目虽然各自独立，但组合使用会形成较完整的增强方案。特别是对于需要在Claude Code中处理复杂、长流程任务的用户而言，同时引入这三个工具能显著提升开发体验的完整度。

开源社区对Claude Code的适配速度远超预期，这说明AI代码生成工具已经进入了"工程化"阶段，开始需要专业级的配套工具链来支撑实际工作流。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：最近用的贼多的 3 个 Claude Code 开源宝藏：WaveTerm、Claude HUD、浏览器自动化

请登录后发表评论

最近用的贼多的 3 个 Claude Code 开源宝藏：WaveTerm、Claude HUD、浏览器自动化

一、WaveTerm：统一工作界面的终端解决方案

核心定位

功能特性

应用场景

安装部署

项目信息

二、Claude HUD：运行时状态透明化插件

核心定位

功能特性

应用价值

安装部署

项目信息

三、chrome-cdp-skill：浏览器自动化的Skill扩展

核心定位

技术架构

功能范围

应用场景

安装配置

项目信息

工具选型对标表

总结

文章目录

关注「苏米客」公众号