从去年开始,AI Agent 火得一塌糊涂。从 AutoGPT 到各种浏览器自动化工具,大家都在做同一件事:让 AI 替人类操作网页。
但用过这类工具的人都知道,现实远比想象骨感。传统的浏览器自动化,本质上是在"教 AI 用人类的方式上网"——开发者预先写好一堆工具函数,定义好每一步该点哪里、填什么。AI 只是一个执行者,按部就班地调用这些预设好的能力。
这种模式有个致命缺陷:互联网是活的。网页每天都在变,新的交互形式层出不穷。预置的工具函数永远追不上现实世界的复杂度。
就在前几天,GitHub 明星项目 Browser Use(GitHub 上 88k+ Star 的浏览器自动化框架)团队,扔出了一个堪称"反常识"的实验性项目——Browser Harness。

他们没有选择继续堆功能、加适配,而是做了一件极其大胆的事:
把控制权完全交给 AI,让 Agent 自己在任务过程中写代码、补功能、沉淀经验。
整个项目只有 592 行 Python 代码。没有框架,没有预设流程,没有复杂配置。就是一根 WebSocket 直连 Chrome,然后让 AI 自己发挥。
开源没几天就已经收获了 3.2K Star,反响剧烈!
项目简介
Browser Harness 是 Browser Use 团队开源的一个实验性项目,定位为"最简单、最轻量、自愈式的浏览器控制工具"。
与传统的浏览器自动化工具不同,Browser Harness 不依赖任何中间框架,也不需要开发者预先写好流程模板。它直接通过 WebSocket 连接 Chrome 浏览器,整个核心代码只有区区 592 行 Python 代码。
这个项目的特点可以用三个"无"来概括:
- 无框架:没有复杂的抽象层,直接基于 Chrome DevTools Protocol (CDP)
- 无预设:没有固定的流程模板,AI 完全自主决定如何完成任务
- 无约束:没有限制性的"护栏",AI 可以自由探索和尝试
这种极简的设计理念,让 Browser Harness 展现出了惊人的灵活性和强大的自愈能力。
核心亮点
1. 实时补充功能,边做边写
Browser Harness 最令人惊叹的特性是它允许 AI 在任务执行过程中实时编写缺失的功能。这个过程完全自动进行,不需要人工干预。AI 会根据任务需求,当场补充需要的功能,真正做到了"遇到问题,解决问题"。
2. 自动沉淀技能,越用越聪明
除了实时编写功能,Browser Harness 还能自动将学到的操作路径沉淀为技能文件。
当 AI 完成一个任务后,它会总结这次任务中学到的经验,包括:
- 网站的选择器
- 操作流程
- 边界情况处理
这些经验会被保存到 domain-skills/ 目录下,下次遇到同类网站或任务时,AI 就可以直接复用这些技能,无需重新摸索。
项目中已经内置了一些现成的技能文件,包括 GitHub、LinkedIn、Amazon 等常见网站,你可以直接参考使用。
3. 即插即用,适配主流 AI 工具
Browser Harness 的设计非常友好,可以直接适配 Claude Code 和 Codex 等主流 AI 编程工具。
你只需要按照项目提供的 setup prompt 粘贴到 Claude Code 或 Codex 中,AI 就会帮你完成安装和配置,然后就可以开始使用了。
技术架构
Browser Harness 的代码结构极其精简,整个项目只有几个核心文件:
| 文件 | 行数 | 功能 |
|---|---|---|
| install.md | - | 首次安装和浏览器引导文档 |
| SKILL.md | - | 日常使用说明 |
| run.py | ~36 行 | 预加载 helpers 的纯 Python 运行脚本 |
| helpers.py | ~195 行 | 初始工具调用集合,AI 会编辑这些 |
| admin.py + daemon.py | ~361 行 | 守护进程引导 + CDP WebSocket 和套接字桥接 |
总计:592 行 Python 代码!
这就是 Browser Harness 全部的核心代码。没有复杂的依赖,没有层层封装,一切都尽可能保持简单和透明。
技术栈
Browser Harness 直接基于 Chrome DevTools Protocol (CDP) 构建,通过一个 WebSocket 连接直接与 Chrome 浏览器通信,中间没有任何额外的框架层。
这种架构带来了几个显著的优势:
- 高性能:没有中间层的开销,通信延迟极低
- 透明:可以直接看到和控制所有浏览器操作
- 灵活:不受框架限制,可以实现任何浏览器功能
- 轻量:代码量极小,易于理解和修改
快速上手
Browser Harness 的安装非常简单,主要步骤如下:
- 阅读 install.md:首先阅读项目中的 install.md 文件,了解如何安装和连接浏览器
- 阅读 SKILL.md:然后阅读 SKILL.md 了解日常使用方法
- 阅读 helpers.py:务必阅读 helpers.py,因为这是函数存放的地方
- 粘贴 setup prompt:将项目提供的 setup prompt 粘贴到 Claude Code 或 Codex 中
- 完成配置:AI 会帮你完成剩余的安装和配置工作
项目还提供了免费的远程浏览器服务,非常适合子代理或部署场景:
- 免费套餐:3 个并发浏览器
- 可以在 cloud.browser-use.com/new-api-key 获取 API Key
- 也可以让 AI 通过 docs.browser-use.com/llms.txt 自行注册
总结
Browser Harness 用 592 行代码向我们展示了一个全新的浏览器自动化范式。
它不是另一个 Selenium 或 Playwright,而是一个完全不同的思路:
- 极简:没有复杂的框架,直接连接浏览器
- 自愈:AI 可以实时编写缺失的功能
- 学习:自动沉淀经验,越用越聪明
- 自由:给 AI 完全的自主权,没有预设约束
苏米注:Browser Harness 的设计理念非常值得借鉴——把控制权交给 AI,让它自己在实践中学习和成长。这种"自愈式"的架构解决了传统浏览器自动化工具的最大痛点:无法应对网页变化。592 行代码就能实现如此强大的功能,说明极简设计 +AI 自主性可以产生惊人的效果。对于需要浏览器自动化的开发者来说,这个项目值得一试。