10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

Stagehand:AI浏览器自动化神器,告别繁琐的网页操作!

4月前 AI开源项目 1857 0

你有时是不是也想要一套完美的浏览器自动化工具,能快速处理各种网页操作。尤其是做爬虫或者自动化测试的时候。

别担心,今天介绍一个超厉害的开源项目来解决这个问题。它包含的功能比较齐全,而且社区还很活跃。绝对会惊掉你的下巴。

Stagehand 是一个AI驱动的浏览器自动化框架,基于Playwright开发,包含的功能比较多(包含了:自然语言操作、计算机使用模型、数据提取、动作预览、缓存机制等),用它能很快的实现复杂的网页自动化任务。

如果你也好折腾各种自动化脚本或者正好要搭建一个智能的网页操作系统,那么这个项目我劝你一定要收藏起来。

应用特性

  • AI驱动操作,话说现在好的自动化工具都集成了人工智能技术

  • 基于自然语言指令,提供了丰富的操作支持(点击、输入、提取、导航等)

  • 基于Playwright的可靠架构

  • 支持多种AI模型(OpenAI、Anthropic等计算机使用模型)

  • 基于代码与自然语言结合的灵活性

  • 统一的页面操作接口,快速能够切换各种操作模式

  • 动作预览功能

  • 缓存重复操作

  • 数据提取工具

  • 一行代码集成能力

它还支持二次开发,能够很轻松地根据不同的自动化需求进行扩展,避免了从零开始造轮子的麻烦,能帮你节省不少时间。

 

应用技术

  • 自动化框架:使用 Playwright + TypeScript 框架,性能高也稳定。

  • AI模型:支持 OpenAI、Anthropic 等主流计算机使用模型,也可以很方便的进行切换。

  • 前端技术:基于 Node.js + TypeScript,UI 美观大方,交互体验流畅。

  • 接口规范:采用模块化设计,标准的API接口,可以很方便的对接各种应用。

部署教程

想要快速跑起来其实非常简单,照着官网的介绍,几分钟就能搞定: 1、准备环境:需要安装 Node.js(16+)。 2、创建项目:

# 一键创建项目
npx create-browser-app
​
# 手动安装
git clone https://github.com/browserbase/stagehand.git
cd stagehand
pnpm install
pnpm playwright install

3、编写自动化脚本:创建你的第一个AI驱动的浏览器自动化。

import { Stagehand } from "@browserbasehq/stagehand";
​
const stagehand = new Stagehand({
apiKey: process.env.OPENAI_API_KEY,
});
​
await stagehand.init();
​
// 使用Playwright函数
const page = stagehand.page;
await page.goto("https://github.com/browserbase");
​
// 使用AI执行操作
await page.act("click on the stagehand repo");
​
// 使用计算机使用代理
const agent = stagehand.agent({
  provider: "openai",
  model: "computer-use-preview",
});
await agent.execute("Get to the latest PR");
​
// 提取页面数据
const { author, title } = await page.extract({
instruction: "extract the author and title of the PR",
schema: z.object({
  author: z.string().describe("The username of the PR author"),
  title: z.string().describe("The title of the PR"),
}),
});

以上命令执行完毕就能看到AI开始自动操作浏览器,完成各种复杂任务了,整个过程 10 分钟左右。

推荐原因

为什么我要强烈推荐这个项目呢?好东西当然要推荐,当然也是因为它太牛B了:

  • 学习价值高:项目用 AI + Playwright 做了一个完整的智能自动化实践,非常适合学习。尤其是毕业生,研究一遍几乎可以做项目了

  • 开箱即用:常用自动化功能都自带,可以省去大量重复开发的工作。节省的时间打打王者不香吗

  • 社区活跃:GitHub 上 star 数量不仅高,社区还挺活跃,更新也比较频繁。如果有兴趣也可以参与一下。

  • 扩展性强:模块化设计,很方便后续接入自己的自动化逻辑。

无论你是想拿它来做网页爬虫,还是用来学习AI驱动的自动化开发,Stagehand 都是一个不错的选择

项目地址:https://github.com/browserbase/stagehand

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Stagehand:AI浏览器自动化神器,告别繁琐的网页操作!
#AI浏览器 #Stagehand 
收藏 1
DeepSeek又一王炸开源:OCR 终结者登场!DeepSeek-OCR,重新定义AI视觉效率
AutoResearch:让AI自主优化神经网络训练,单卡也能跑的自适应研究系统
推荐阅读
  • Sim :零门槛 AI 工作流神器,60+ 服务随意拼装
  • Clawdbot:最近 GitHub爆火 AI 助手只有几百行代码的,就能用聊天软件远程指挥本地智能体
  • SoulX-Podcast:支持多人对话的方言tts,支持语音克隆,可现实长篇播客,文末一键包
  • AipexBase:国产首个 AI 原生后端开源平台来了,让 AI Coding直接起飞!
  • withoutBG:本地部署的自动抠图!告别在线抠图网站~
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
8178 4月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
6765 6月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
5103 2月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
4919 5月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
4913 6月前
SpecKit:从想法到代码只需5步?这个开源框架把规范驱动开发变成了现实
4627 5月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
4541 6月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
4470 1月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
4287 5月前
Fogsight (雾象):一句话自动生成任何科普动画
3947 5月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 AutoResearch:让AI自主优化神经网络训练,单卡也能跑的自适应研究系统
2 MindPocket:开源AI知识库,让收藏夹变成可全平台同步、自动摘要、智能对话,查询的第二大脑
3 MemOS 开源 OpenClaw 插件,让 AI Agent 拥有可复用的长期记忆
4 Symphony:OpenAI 开源 Symphony AI 编程自主管理神器!
5 AiToEarn:一人公司的 AI 内容营销开源神器,打通自媒体运营全链路
6 NoizAI Skills:给 OpenClaw 小龙虾装上声音Skills,让 AI Agent 开口说话
7 VoxClaw:小龙虾能说话的开源,在 OpenClaw 上集成语音输出能力
8 Google Workspace CLI:这个开源工具让 AI Agent 直接操控你的办公工具,暴涨 14000+ Star!
9 开源项目「肉包」:用视觉推理实现安卓端AI自动化助手
10 waoowaoo:从小说文本到完整视频,AI 短剧一站式生成平台
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联