核心痛点:AI 编程助手的局限性
当前主流的 AI 编程工具普遍存在一个关键问题:它们更像是"高级打字员",而非真正的开发伙伴。用户让写什么就写什么,缺乏对产品层面的深度思考,没有架构把控能力,生成的代码缺少测试验证,上线后容易出现各种缺陷。
这种"人指挥机器打字"的模式,看似效率高,实则像没有经验的单干户在野蛮生长,最终需要花费大量时间填补前期挖的坑。
gstack:虚拟开发团队解决方案
gstack 是 Y Combinator 现任负责人 Garry Tan 开源的一套 AI 编程技能集合,在 GitHub 上已获得 64.9k+ stars。它的核心逻辑是将 Claude Code 等主流 AI 编程终端改造成一支随时可调用的虚拟工程团队。

系统包含 23 个专业角色和 8 个强力工具,覆盖从产品构思到代码上线的全生命周期。
核心特点
1. 角色扮演与流程闭环
gstack 模拟了 YC 合伙人的挑战性提问方式,内置 CEO、架构师、设计师、测试工程师、安全专家等不同身份。当提出需求时,系统不会立即写代码,而是像真实团队一样:
- 先反问痛点,推翻不合理的假设
- 规划架构,完成审查后再进入开发
- 各角色之间上下文连贯,设计文档自动流转给审查人员
苏米注:这种设计巧妙地将工程化思维注入 AI 执行过程,让 AI 具备团队协作智慧和严谨的流程管控。
2. 多 AI 模型协同
支持多模型协同工作,例如用 Claude 写代码,同时调用 OpenAI 的 Codex 做独立的交叉代码审查,找出单一模型容易忽略的盲区。
技术架构
gstack 不是传统的前后端分离 Web 应用,而是一套基于 Markdown 提示词和 Shell 脚本构建的 AI Agent 技能调度系统。底层通过宿主 AI 编程终端的能力,将复杂的工程任务拆解、编排并串联执行。所有逻辑、状态流转和记忆机制都在本地文件系统和终端会话中闭环完成。
部署方式
部署过程极其轻量,无需配置数据库或环境变量。只需电脑上装好 Claude Code、Git 和 Bun 运行时,在终端执行一行克隆安装脚本,约 30 秒即可完成全局安装。
系统支持团队共享模式,项目成员拉取代码后能自动同步最新的技能配置,保持团队规范一致。

前端能力:真实浏览器控制
gstack 内置了基于 Chromium 封装的 GStack Browser,具备反机器人检测隐身能力,可以直接打开网页进行可视化走查。AI 在进行 UI 测试时能够:
- 真实打开页面、填写表单
- 截取屏幕画面
- 发现样式错位等视觉问题
这意味着 AI 不再是"靠猜",而是真的"睁开眼睛"进行测试。
后端设计
作为一套依附于宿主终端的技能系统,gstack 没有独立运行的后端服务进程。所有代码生成、逻辑校验、安全审计都在本地终端会话中由 AI 模型直接执行。这种设计避免了额外的网络请求和中间件依赖,数据本地化也消除了服务中断风险。
实际使用流程
以开发日程管理应用为例,gstack 的工作流程与传统对话式编程完全不同:
- 产品规划:输入
/office-hours命令,AI 化身产品负责人追问痛点场景,梳理核心能力和实现路径,生成设计文档 - 架构审查:输入
/plan-eng-review,架构师角色介入,画出数据流向图、状态机,列出边界情况和测试矩阵 - 代码生成:确认方案后,AI 用约 8 分钟自动生成 2000+ 行涵盖十几个文件的代码
- 代码审查:输入
/review,资深工程师逐行审查,自动修复低级错误 - QA 测试:输入
/qa并附上本地测试地址,测试工程师打开真实浏览器模拟用户操作,发现 Bug 自动修复并补充回归测试 - 发布上线:输入
/ship,自动跑通测试、生成覆盖率报告并提交代码请求

苏米注:从提出想法到代码合入,一个人一台电脑就能走完成熟团队一两周的敏捷迭代流程,这种效率提升是颠覆性的。
开源协议
gstack 遵循 MIT 协议开源,可以免费用于个人学习、公司内部商业项目,也可以在此基础上进行二次开发并闭源售卖,仅需保留原始版权声明。
总结与建议
核心价值:AI 时代的软件开发模式正在发生剧变,真正的壁垒在于如何把工程化思维注入 AI 执行过程,让它具备团队协作智慧和严谨的流程管控。
最佳实践:对于正在一线写代码的开发者,建议亲自体验 gstack 的完整工作流,特别是产品规划→架构审查→代码生成→测试发布的闭环流程,感受与传统对话式编程的差异。
踩坑记录:使用多模型协同时,注意配置好各模型的 API 密钥和调用限额,避免因某个模型限流导致整个流程中断。