10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

Stagehand:AI浏览器自动化神器,告别繁琐的网页操作!

7月前 AI开源项目 2319 0

你有时是不是也想要一套完美的浏览器自动化工具,能快速处理各种网页操作。尤其是做爬虫或者自动化测试的时候。

别担心,今天介绍一个超厉害的开源项目来解决这个问题。它包含的功能比较齐全,而且社区还很活跃。绝对会惊掉你的下巴。

Stagehand 是一个AI驱动的浏览器自动化框架,基于Playwright开发,包含的功能比较多(包含了:自然语言操作、计算机使用模型、数据提取、动作预览、缓存机制等),用它能很快的实现复杂的网页自动化任务。

如果你也好折腾各种自动化脚本或者正好要搭建一个智能的网页操作系统,那么这个项目我劝你一定要收藏起来。

应用特性

  • AI驱动操作,话说现在好的自动化工具都集成了人工智能技术

  • 基于自然语言指令,提供了丰富的操作支持(点击、输入、提取、导航等)

  • 基于Playwright的可靠架构

  • 支持多种AI模型(OpenAI、Anthropic等计算机使用模型)

  • 基于代码与自然语言结合的灵活性

  • 统一的页面操作接口,快速能够切换各种操作模式

  • 动作预览功能

  • 缓存重复操作

  • 数据提取工具

  • 一行代码集成能力

它还支持二次开发,能够很轻松地根据不同的自动化需求进行扩展,避免了从零开始造轮子的麻烦,能帮你节省不少时间。

 

应用技术

  • 自动化框架:使用 Playwright + TypeScript 框架,性能高也稳定。

  • AI模型:支持 OpenAI、Anthropic 等主流计算机使用模型,也可以很方便的进行切换。

  • 前端技术:基于 Node.js + TypeScript,UI 美观大方,交互体验流畅。

  • 接口规范:采用模块化设计,标准的API接口,可以很方便的对接各种应用。

部署教程

想要快速跑起来其实非常简单,照着官网的介绍,几分钟就能搞定: 1、准备环境:需要安装 Node.js(16+)。 2、创建项目:

# 一键创建项目
npx create-browser-app
​
# 手动安装
git clone https://github.com/browserbase/stagehand.git
cd stagehand
pnpm install
pnpm playwright install

3、编写自动化脚本:创建你的第一个AI驱动的浏览器自动化。

import { Stagehand } from "@browserbasehq/stagehand";
​
const stagehand = new Stagehand({
apiKey: process.env.OPENAI_API_KEY,
});
​
await stagehand.init();
​
// 使用Playwright函数
const page = stagehand.page;
await page.goto("https://github.com/browserbase");
​
// 使用AI执行操作
await page.act("click on the stagehand repo");
​
// 使用计算机使用代理
const agent = stagehand.agent({
  provider: "openai",
  model: "computer-use-preview",
});
await agent.execute("Get to the latest PR");
​
// 提取页面数据
const { author, title } = await page.extract({
instruction: "extract the author and title of the PR",
schema: z.object({
  author: z.string().describe("The username of the PR author"),
  title: z.string().describe("The title of the PR"),
}),
});

以上命令执行完毕就能看到AI开始自动操作浏览器,完成各种复杂任务了,整个过程 10 分钟左右。

推荐原因

为什么我要强烈推荐这个项目呢?好东西当然要推荐,当然也是因为它太牛B了:

  • 学习价值高:项目用 AI + Playwright 做了一个完整的智能自动化实践,非常适合学习。尤其是毕业生,研究一遍几乎可以做项目了

  • 开箱即用:常用自动化功能都自带,可以省去大量重复开发的工作。节省的时间打打王者不香吗

  • 社区活跃:GitHub 上 star 数量不仅高,社区还挺活跃,更新也比较频繁。如果有兴趣也可以参与一下。

  • 扩展性强:模块化设计,很方便后续接入自己的自动化逻辑。

无论你是想拿它来做网页爬虫,还是用来学习AI驱动的自动化开发,Stagehand 都是一个不错的选择

项目地址:https://github.com/browserbase/stagehand

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Stagehand:AI浏览器自动化神器,告别繁琐的网页操作!
#AI浏览器 #Stagehand 
收藏 1
DeepSeek又一王炸开源:OCR 终结者登场!DeepSeek-OCR,重新定义AI视觉效率
字节又出狠活:免费开源的 DreamOmni2,让图像编辑变成一句话的事
推荐阅读
  • Google AI Edge Gallery:把大模型装进口袋,支持 iOS 和 Android 系统的端侧 AI 神器
  • Karakeep:开源自托管书签神器,AI智能标记让收藏更轻松
  • Claudeception:这个Skill会自我学习,自动分析Claude Code工作模式
  • AingDesk:一站式本地AI桌面平台,3分钟部署大模型,免费开源可离线运行
  • OpenScreen:一款开源录屏工具,Screen Studio、Cursorful免费平替
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
9453 7月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
9253 9月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
7268 5月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
6467 4月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
6329 9月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
6219 8月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
6112 7月前
CapCut API:一个剪映API开源项目,让AI自动剪辑视频
6053 5月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5658 9月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5584 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Ant Design Pro :2026 年企业级 React 应用的标准方案
2 HTML版剪映来了:OpenDesign团队开源HTML-Video
3 Codex++ 开源:让 OpenAI Codex 接入国产大模型,告别 ChatGPT 订阅
4 37 个精选 AI 开源项目清单:Agent、编程、设计全覆盖
5 BrowserAct 开源项目:解决 Agent 浏览器自动化难题,支持 Cookie 复用与人机接力
6 SoulX-Transcriber 开源多人对话转录模型:端到端架构,性能登顶公开基准测试
7 Cua 开源项目:让 AI Agent 安全控制桌面的三层架构(1.7万 Star)
8 OmniVoice Studio:免费开源AI语音生成工具,3秒克隆音色+视频自动配音
9 MarkItDown:微软开源文档转Markdown工具,14万Star助力AI数据处理
10 Lingji Cut(灵剪):开源本地优先的 AI 视频全链路创作工作台
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联