10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

Stagehand:AI浏览器自动化神器,告别繁琐的网页操作!

1月前 AI开源项目 1313 0

你有时是不是也想要一套完美的浏览器自动化工具,能快速处理各种网页操作。尤其是做爬虫或者自动化测试的时候。

别担心,今天介绍一个超厉害的开源项目来解决这个问题。它包含的功能比较齐全,而且社区还很活跃。绝对会惊掉你的下巴。

Stagehand 是一个AI驱动的浏览器自动化框架,基于Playwright开发,包含的功能比较多(包含了:自然语言操作、计算机使用模型、数据提取、动作预览、缓存机制等),用它能很快的实现复杂的网页自动化任务。

如果你也好折腾各种自动化脚本或者正好要搭建一个智能的网页操作系统,那么这个项目我劝你一定要收藏起来。

应用特性

  • AI驱动操作,话说现在好的自动化工具都集成了人工智能技术

  • 基于自然语言指令,提供了丰富的操作支持(点击、输入、提取、导航等)

  • 基于Playwright的可靠架构

  • 支持多种AI模型(OpenAI、Anthropic等计算机使用模型)

  • 基于代码与自然语言结合的灵活性

  • 统一的页面操作接口,快速能够切换各种操作模式

  • 动作预览功能

  • 缓存重复操作

  • 数据提取工具

  • 一行代码集成能力

它还支持二次开发,能够很轻松地根据不同的自动化需求进行扩展,避免了从零开始造轮子的麻烦,能帮你节省不少时间。

 

应用技术

  • 自动化框架:使用 Playwright + TypeScript 框架,性能高也稳定。

  • AI模型:支持 OpenAI、Anthropic 等主流计算机使用模型,也可以很方便的进行切换。

  • 前端技术:基于 Node.js + TypeScript,UI 美观大方,交互体验流畅。

  • 接口规范:采用模块化设计,标准的API接口,可以很方便的对接各种应用。

部署教程

想要快速跑起来其实非常简单,照着官网的介绍,几分钟就能搞定: 1、准备环境:需要安装 Node.js(16+)。 2、创建项目:

# 一键创建项目
npx create-browser-app
​
# 手动安装
git clone https://github.com/browserbase/stagehand.git
cd stagehand
pnpm install
pnpm playwright install

3、编写自动化脚本:创建你的第一个AI驱动的浏览器自动化。

import { Stagehand } from "@browserbasehq/stagehand";
​
const stagehand = new Stagehand({
apiKey: process.env.OPENAI_API_KEY,
});
​
await stagehand.init();
​
// 使用Playwright函数
const page = stagehand.page;
await page.goto("https://github.com/browserbase");
​
// 使用AI执行操作
await page.act("click on the stagehand repo");
​
// 使用计算机使用代理
const agent = stagehand.agent({
  provider: "openai",
  model: "computer-use-preview",
});
await agent.execute("Get to the latest PR");
​
// 提取页面数据
const { author, title } = await page.extract({
instruction: "extract the author and title of the PR",
schema: z.object({
  author: z.string().describe("The username of the PR author"),
  title: z.string().describe("The title of the PR"),
}),
});

以上命令执行完毕就能看到AI开始自动操作浏览器,完成各种复杂任务了,整个过程 10 分钟左右。

推荐原因

为什么我要强烈推荐这个项目呢?好东西当然要推荐,当然也是因为它太牛B了:

  • 学习价值高:项目用 AI + Playwright 做了一个完整的智能自动化实践,非常适合学习。尤其是毕业生,研究一遍几乎可以做项目了

  • 开箱即用:常用自动化功能都自带,可以省去大量重复开发的工作。节省的时间打打王者不香吗

  • 社区活跃:GitHub 上 star 数量不仅高,社区还挺活跃,更新也比较频繁。如果有兴趣也可以参与一下。

  • 扩展性强:模块化设计,很方便后续接入自己的自动化逻辑。

无论你是想拿它来做网页爬虫,还是用来学习AI驱动的自动化开发,Stagehand 都是一个不错的选择

项目地址:https://github.com/browserbase/stagehand

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Stagehand:AI浏览器自动化神器,告别繁琐的网页操作!
#AI浏览器 #Stagehand 
收藏 1
DeepSeek又一王炸开源:OCR 终结者登场!DeepSeek-OCR,重新定义AI视觉效率
AiProPortrait:一句话生成高清职业头像,LinkedIn/简历/官网即插即用
推荐阅读
  • Stirling-PDF:基于 Web 的本地化开源 PDF 处理工具
  • SpecKit:从想法到代码只需5步?这个开源框架把规范驱动开发变成了现实
  • AstrBot:最强AI Agent聊天机器人平台横空出世,一键打通QQ/微信/飞书,主流模型随心配!
  • OmniBox:开源AI知识管理系统,让你的收藏夹不再吃灰!
  • next-ai-draw-io:一键生成各类复杂专业图表、流程图、架构图
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
5701 1月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
4262 1月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
3830 2月前
SpecKit:从想法到代码只需5步?这个开源框架把规范驱动开发变成了现实
3314 1月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
3114 3月前
SurfSense:私人AI研究助手,私有版的NotebookLM 和 Perplexity开源平替,
3031 1月前
KrillinAI:开源AI视频翻译配音工具,100种语言双向翻译,一键部署全流程
2865 1月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
2308 2月前
Bytebot:开源AI桌面代理(Desktop Agent),给AI配一台自己的电脑
2232 2月前
Fogsight (雾象):一句话自动生成任何科普动画
2227 1月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 LocalAI:不花钱、不断网、不怕泄密,把 AI 大模型装进你的本地服务器!
2 Khoj:你的开源“AI 第二大脑”,如何把个人知识库变成可对话的 AI 系统
3 AnythingLLM:一个全栈式的本地化私有知识库与企业级文档聊天平台
4 withoutBG:本地部署的自动抠图!告别在线抠图网站~
5 YPrompt:把零散Prompt提示词变成可管理的知识库,提示词管理系统
6 SeekDB:一款AI原生的混合搜索数据库!还支持MCP
7 next-ai-draw-io:一键生成各类复杂专业图表、流程图、架构图
8 APITable:开源可视化数据库,用表格界面快速搭建业务管理系统
9 EasyAIoT:工业物联网的开源边端一体化平台
10 Lobe Chat:LLMs 聊天应用与开发框架,AI 大模型操作台
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联