#agent
扣子2.0上线,四大Agent能力直接炸场,还有限时用户福利!
今天扣子正式推出 2.0 版本。自2024年2月首次亮相以来,扣子已经陪伴用户走过七百多个日夜,帮助无数职场人解决工作难题。
如今,扣子2.0以全新的Agent能力体系,从"帮把手"的工具升级为能主动推进、持续执行的靠谱伙伴。核心升级包括…
OctoCodingBench :MiniMax 开源的 Coding Agent 评测数据集与流程
过去几个月,我几乎每周都换着法子试 Coding Agent:从 Cursor 到 TRAE,再到 Claude Code。
一个越来越明确的感受是——能跑不等于能用。
很多时候,模型把测试跑通了,但把仓库规约、权限…
Agent原生架构范式,实测Claude Code把智能体变成能完成任务的协同工具
过去几个月,我作为产品经理在大量试用和拆解AI产品的过程中,明显感到智能体的开发方式在变化。
此前更多是“拼功能、写路由”的过程型智能体:把操作打包成一个个工具,按流程走完就算交付。
但在实测使用Claude Cod…
GoogleAntigravity 宣布原生支持 Agent Skills,正在变成通用标准:后的实践观察与迁移建议
这两天我把 Google Antigravity 的新版本更新一下,最直接的感受是:Agent Skills 的标准化速度比我预期快。
Antigravity 宣布原生支持之后,主流 Agent 平台CLI Claude Code/Code…
Agentic:首个开源MCP商业化平台,让AI工具实现按量计费
在浏览了近百个AI开源项目后,我发现大多数工具市场都存在一个通病:堆砌数量、忽视质量。
直到最近接触到Agentic这个项目,才真正看到有人在认真解决"AI工具可用性"这个核心问题。
18.1K Star的热度背后,是首个将MCP(Mode…
Claude Skills 资源合集,16个Agent Skills资源从基础到实战涵盖完整学习路径
近期Claude Skills(Agent Skills)的热度持续上升,我在学习和体验的过程中积累了不少优质学习资源。与其埋在收藏夹里,不如系统地整理出来,供有兴趣深入了解Agent Skills的从业者参考。这份汇总涵盖了从基础概念到实…
用 Claude Code 打造你的 PR 评审团
我一直在思考一个问题:如何让代码审查从"运气游戏"变成"系统流程"?直到接手了一个典型的"遗留项目"后,这个问题变得尤为迫切。
那段时间,每次提PR都像在赌博——空的try-catch块、与代码完全不符的注释、形同虚…
OpenCode + oh-my-opencode,这才是编程AI Agent该有的样子
作为长期评测 AI 开发工具的产品经理,我对“AI 写代码”这类产品向来谨慎。多数工具能快速生成片段,但难以在真实项目里长期稳定地协作。
过去一段时间我在两个持续迭代的代码库里用 OpenCode 做了多轮试用,最大…
MiroThinker:突破参数规模内卷的开源搜索Agent框架
最近在刷GitHub开源项目时,发现了一个有意思的现象:当整个AI产业还在疯狂堆砌参数规模的时候,有团队却走了完全不同的路线。
MiroMind AI开源的MiroThinker v1.5引起了我的关注,2300+点赞的搜索Agent,核…
AI Agent从架构到落地全解析,别再交付功能,交付能把事办成的数字员工
做产品这些年,我最害怕的复盘问题是:这个页面上线后,具体办成了哪件事?
不是PV,也不是点击率,而是有形的业务结果。
两年前,我还在展示一堆漂亮的报表;这两年,越来越多的业务同事问我,系统能不能直接把价格调了、促销发出去、库存挪一下。
换句…