10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

pi-mono 详解:4 万 Star 的 AI Agent 底层框架,OpenClaw 为什么选它?

1小时前 AI开源项目 10 0

2026 年,AI Agent 开发已经进入了「站在巨人肩膀上」的阶段。如果你正在寻找一个足够干净、足够灵活的底层框架来构建自己的 Agent,pi-mono 是目前 GitHub 上最值得深入研究的项目之一。

这个 TypeScript 单仓项目已经突破了 4 万 Star,而它的成功有一个重要的佐证:OpenClaw 的核心运行时正是基于 pi-mono 的 SDK 构建的。OpenClaw 在 README 中专门感谢了作者 Mario Zechner 和 pi-mono 项目。

为什么 OpenClaw 会选择 pi-mono 作为底层?答案在于它做到了一个看似矛盾的事:极致极简,却又不失强大。

pi-mono 是什么?

pi-mono 是一个专门用于构建 AI Agent 和管理 LLM 部署的 TypeScript 单仓项目。它的核心产品叫 Pi,是一个运行在终端里的编程 Agent,支持在项目中直接读文件、写文件、编辑代码和执行命令。

作者 Mario Zechner(网名 badlogic)是知名游戏框架 libGDX 的创作者。他在 AI Engineer London 大会上的演讲标题相当直接:「我讨厌每一个 Coding Agent,所以我自己写了一个。」

开源地址:github.com/badlogic/pi-mono

极简哲学:少即是多

Pi 与其他 Coding Agent 最大的区别在于设计哲学。大多数 Agent 工具不断堆砌功能——MCP 支持、子 Agent、Plan 模式、权限弹窗、内置 Todo。而 Pi 反其道而行之。

它的核心只有四个工具:read、write、edit、bash。系统提示词不到 1000 个 token,是所有主流 Agent 中最短的。

它刻意没有内置以下功能:

  • 没有 MCP
  • 没有子 Agent
  • 没有权限弹窗
  • 没有 Plan 模式
  • 没有内置 Todo
  • 没有后台 Bash

这些功能不是做不了,而是通过 Extensions、Skills、Packages 按需扩展。Pi 的理念是:让工具适应你的工作流,而不是让你适应工具。

苏米注:这种「干净内核 + 按需扩展」的设计思路非常值得学习。底层越干净,上层能搭的东西就越灵活,OpenClaw 的选择已经证明了这一点。

架构拆解:七个包各司其职

pi-mono 把 Agent 开发需要的每一层都拆成了独立的 npm 包,每个包都可以单独使用:

包名 用途 关键特性
pi-ai 统一多提供商 LLM API 一个接口对接 20+ 提供商,抹平 API 差异
pi-agent-core Agent 运行时 工具调用循环、状态管理、上下文维护
pi-coding-agent 终端编程 Agent 主产品 完整会话管理、扩展系统、UI 渲染,暴露 SDK
pi-tui 终端 UI 库 差分渲染引擎,终端里渲染漂亮界面
pi-web-ui Web 端聊天组件 浏览器 AI 对话界面
pi-mom Slack 机器人 频道消息自动委托给 Pi Agent
pi-pods vLLM 部署管理 远程 GPU 上的推理服务管理

你不需要用整个 Pi——只用 pi-ai 统一 LLM 调用也行,只用 pi-agent-core 构建自己的 Agent 运行时也行。这就是模块化设计的价值。

核心特性一览

20+ LLM 提供商统一接入

一个 API 对接 20 多个提供商,支持 API Key 和 OAuth 订阅登录两种认证方式。你可以直接用 Anthropic Claude Pro/Max、OpenAI ChatGPT Plus、GitHub Copilot 的订阅来跑 Pi,无需单独购买 API 额度。

快捷键支持:Ctrl+L 切换模型,Ctrl+P 在多个模型间快速轮换。

树状会话分支

Pi 的会话用 JSONL 文件存储,每个条目有 id 和 parentId,形成树状结构。你可以在任意历史节点分叉探索新方向,所有历史保留在一个文件里。输入 /tree 查看完整对话树,支持折叠、展开、搜索、跳转——像 Git 一样管理对话历史。

Extensions 扩展机制

用 TypeScript 编写扩展,可自定义工具、命令、快捷键、UI 组件,甚至替换内置工具或添加自定义 LLM Provider。社区里有人做了 Doom 扩展,在等待 Agent 回复时可以在终端里打 Doom。

Skills 技能系统

遵循 Agent Skills 标准,一个 Markdown 文件就是一个技能,零代码扩展 Agent 能力。

Pi Packages 生态

将扩展、技能、提示词模板、主题打包成 npm 包,一行命令安装:

pi install npm:@foo/pi-tool
pi install git:github.com/user/repo

社区包画廊:pi.dev/packages

四种运行模式

  • 交互终端模式(默认):直接对话
  • Print/JSON 模式:非交互输出
  • RPC 模式:通过 stdin/stdout 做 JSON-RPC 通信
  • SDK 模式:作为库嵌入自己的应用(OpenClaw 的用法)

上下文压缩

支持自动和手动两种压缩方式,将旧消息总结精简,最近对话保持原样。完整历史仍在文件里,随时通过 /tree 回溯。

5 分钟快速上手

安装只需一行命令:

npm install -g @mariozechner/pi-coding-agent

设置 API Key 或使用订阅登录:

export ANTHROPIC_API_KEY=sk-ant-...
pi
# 或输入 /login,选择提供商,浏览器完成授权

常用快捷键:

  • Ctrl+L:切换模型
  • Ctrl+P:多模型轮换
  • Shift+Tab:切换思考等级
  • 双击 Escape:打开对话树

输入 @ 可模糊搜索项目文件引用,输入 ! 加命令可直接运行 bash 并将结果发给 LLM。

社区与文化

Pi 的社区有几个值得关注的特色:

贡献者晋升机制:通过 lgtmi 和 lgtm 两个等级晋升,拿到 lgtm 才能提交 PR。唯一规则:你必须理解自己提交的代码。用 AI 辅助编写可以,但不理解就提交不行。

OSS Session 分享计划:作者鼓励用户将真实的编程会话数据发布到 Hugging Face,包含完整的工具调用、失败和修复过程。这比玩具基准测试更有价值。作者自己在 Hugging Face 上已公开了 627 条以上的 pi-mono 工作会话。

为什么值得研究

和 Claude Code 相比,Pi 更极简、更可定制。它是终端原生工具而非 IDE 插件,更轻量也更透明——系统提示词不到 1000 token,所有行为可见。

如果你是一个 Agent 开发者,想基于成熟底层搭建自己的产品,Pi 的 SDK 和 pi-ai 包就是为你准备的。OpenClaw 已经证明了这条路走得通。

最简洁的底层,支撑起了最复杂的应用。2026 年想造自己的 Agent,不要从零开始。先把 pi-mono 吃透,看看别人是怎么把 Agent 的每一层抽象做干净的,然后再决定自己要在哪一层创新。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:pi-mono 详解:4 万 Star 的 AI Agent 底层框架,OpenClaw 为什么选它?
#pi-mono #AI Agent #OpenClaw #开源项目 #编程工具 
收藏 1
Hermes 长期记忆配置教程:用 Mem0 让 AI Agent 记住你的偏好和项目历史
DeepSeek-V4 满血版免费使用教程:NVIDIA NIM 平台接入指南
推荐阅读
  • 6 款开源 CLI 工具合集:AI 驱动的命令行开发体验
  • Wei-Yu(微语):开源版飞书+钉钉!企业级IM系统,内置在线客服 + 知识库 + 工单系统 + AI问答等
  • Eigent:平替Claude Cowork开源多智能体工作流桌面应用,让AI真正接管你的工作流
  • Jellyfish:一站式 AI 短剧创作平台,剧本一键转分镜,快速生成竖屏/微短剧
  • WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
8949 6月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
8071 7月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
6157 3月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
5745 2月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
5515 7月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5325 8月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
5262 7月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5217 6月前
SpecKit:从想法到代码只需5步?这个开源框架把规范驱动开发变成了现实
5088 6月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
5069 6月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 pi-mono 详解:4 万 Star 的 AI Agent 底层框架,OpenClaw 为什么选它?
2 free-claude-code 开源代理:零成本使用 Claude Code,支持 NVIDIA NIM 等免费模型
3 awesome-gpt-image-2:1849 条 GPT Image 2 提示词精选,覆盖 16 个场景类别
4 LLM Wiki 开源知识库应用:基于 Karpathy 方法论,让 AI 自动构建个人知识体系
5 Kami 开源文档设计系统:统一设计规范,让 AI 生成的文档直接可用
6 FireRed-OpenStoryline: 开源视频创作工具,一句话生成完整视频
7 CowAgent vs OpenClaw 对比评测:微信接入 AI 助手哪个更适合你?
8 Modly 开源工具详解:本地运行 AI 将 2D 照片转为 3D 模型,支持 Windows/Linux
9 YC 总裁 Garry Tan 开源 GBrain:给 AI Agent 装上长期记忆,12 天打造自进化记忆系统
10 llmfit 开源工具:一键检测你的电脑能跑哪些本地大模型
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联