10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

BrowserAct 开源项目:解决 Agent 浏览器自动化难题,支持 Cookie 复用与人机接力

1小时前 AI开源项目 11 0

在使用 Agent 操控浏览器执行任务时,经常遇到一些问题:Agent 打开的浏览器没有 Cookie 记录,每次都需要重新登录;被网页反爬机制拦截;被识别为 Bot;拿不到动态页面数据等。这些问题导致很多自动化工作流无法顺利完成。

BrowserAct 是一个面向 Agent 工具的浏览器自动化 CLI,填补了 Agent 在真实环境中执行任务的"执行层"空缺。

1. 反检测环境

Agent 控制浏览器通常有两种方式:纯视觉方式(较慢)和命令行方式(容易被反爬机制拦截)。BrowserAct 同时支持两种方式,既支持命令行控制,又能绕过部分反爬机制。

2. 三层递进结构

  • 环境层:隐蔽指纹伪装、TLS 轮换、切换代理
  • 执行层:全自动破解验证码,隐蔽提取功能,抓取受保护的页面
  • 人工层:远程协助生成实时链接,用户可从任意设备接管操作,完成任务后无缝续接

当遇到需要人工介入的操作(如验证码或扫码)时,BrowserAct 不会直接中断任务,而是生成一个远程协作链接。人类通过链接完成协作后,Agent 继续执行任务。在等待人工协助的过程中,Agent 会先去执行其他可以执行的工作。

3. 多账号隔离

BrowserAct 通过 Stealth Browser + Static Proxy,将每个账号放在相对独立的浏览器环境中运行。每个浏览器可以绑定独立的登录状态和网络环境,分别执行对应账号下的任务。这适合电商店铺运营和社交媒体自动化运营等需要同时管理多个账号的场景。

4. 并发不串线

每个任务都有独立的浏览器工作区,账号之间互不污染。

5. Skill-Forge 扩展技能

Skill-Forge 是独立于 browser-act 执行入口之外的扩展能力。用户只需描述想要的数据或操作目标,Skill-Forge 会先探索目标网站,分析页面流程、可用 API 和数据字段,生成可部署的 Skill 包。之后 Agent 可以直接复用这套 Skill,沿着已验证过的路径稳定执行批量任务,无需每次重新理解网站。

实际应用场景

场景一:复用已有登录状态

许多 Agent 打开的是全新浏览器环境,进入公众号后台等需要登录的网站时需要重新扫码。BrowserAct 可以在已有的真实浏览器会话中继续执行任务,复用当前已登录的状态,无需重新登录。

对比其他 Agent,它们打开的是没有登录状态的浏览器:

场景二:跳过网站反爬

对于反爬机制严格的网站(如小红书),BrowserAct 可以正常进入页面并提取信息,包括首页推荐内容等。

场景三:人机接力

对于需要登录后才能查看的内容(如知乎),BrowserAct 会生成一个隐私浏览器模式的链接。用户通过该链接在任何设备上完成登录验证后,Agent 即可继续执行任务。

安装方法

将 BrowserAct 的 GitHub 页面地址发送给 Agent,Agent 即可自动开始安装:

https://github.com/browser-act/skills/tree/main/browser-act

总结

Agent 落地真正卡住的往往不是模型参数或提示词优化,而是真实环境中的执行能力。BrowserAct 的出现填补了这部分空缺,通过人机接力作为工作流设计模式,Agent 可以先暂停等待用户完成关键操作后再继续执行,更贴近真实用户的工作方式。

官方网站:www.browseract.ai

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:BrowserAct 开源项目:解决 Agent 浏览器自动化难题,支持 Cookie 复用与人机接力
#BrowserAct #Agent #浏览器自动化 #开源项目 #Cookie复用 
收藏 1
谷歌开源 Gemma 4 12B:统一无编码器架构,16GB 内存笔记本即可运行多模态模型
Claude Code Dynamic Workflows:从 Prompt 到 Loop 的 AI 编程范式转变
推荐阅读
  • pi-mono 详解:4 万 Star 的 AI Agent 底层框架,OpenClaw 为什么选它?
  • JCP:多Agent协作的A股智能分析系统,让AI像研究员一样讨分析股票
  • AingDesk:一站式本地AI桌面平台,3分钟部署大模型,免费开源可离线运行
  • Claude Skills 精选集:提升 AI 工作流效率的开源技能库解析
  • omp 开源发布:Hashline 技术让 AI 编程编辑成功率提升 10 倍,支持 40+ 模型
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
9405 7月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
9157 8月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
7190 5月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
6407 4月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
6274 8月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
6158 8月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
6052 7月前
CapCut API:一个剪映API开源项目,让AI自动剪辑视频
5901 5月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5615 9月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5543 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 BrowserAct 开源项目:解决 Agent 浏览器自动化难题,支持 Cookie 复用与人机接力
2 SoulX-Transcriber 开源多人对话转录模型:端到端架构,性能登顶公开基准测试
3 Cua 开源项目:让 AI Agent 安全控制桌面的三层架构(1.7万 Star)
4 OmniVoice Studio:免费开源AI语音生成工具,3秒克隆音色+视频自动配音
5 MarkItDown:微软开源文档转Markdown工具,14万Star助力AI数据处理
6 Lingji Cut(灵剪):开源本地优先的 AI 视频全链路创作工作台
7 claude-tap:AI Agent 的流量监控与 Token 分析利器
8 Understand-Anything:4.7 万 Star 的开源代码理解工具,快速梳理老旧项目
9 html-anything:从 Markdown 到精美 HTML,只需要点一点(附 75 个模板)
10 OpenSquilla:智能路由 + MetaSkill,让 Agent 省钱又稳定执行的开源方案
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联