#Agent
Vercel 和 Linear 设计工程师开源的 AI 动效审美 Skill
在 AI 编程工具领域,一个常被忽视的痛点是:Agent 写 UI 时功能齐全、代码干净,但细节和交互动画质感差——看起来过于表面和粗糙。按钮反馈弱、动画时机不对、视觉层级混乱,这些设计上的取舍往往是 AI 无法自行…
Harness Engineering:用 Markdown 构建可读可验证的 AI Agent 仓库
在 AI Agent 开发中,我们常常把注意力集中在模型能力上——更大的参数、更好的推理、更长的上下文。但一个被忽视的事实是:当模型能力达到一定阈值后,真正的瓶颈变成了 harness,也就是你围绕模型构建的一切基础…
5 款主流 AI 模型 Agent 任务实测:MiniMax、DeepSeek、Step、GLM、Gemini 对比
市面上能调用的模型越来越多,各家都有自己的亮点,光看宣传文档和跑分数据很难判断哪个真正适合自己——尤其是当任务从单轮对话延伸到多步操作的时候。这次测试把五个主流模型拉出来实际跑一遍,看看它们在真实 Agent 任务中…
SkillsLM:开源多 Agent 技能管理桌面端,实现一处修改处处同步
在多 Agent 协同开发的今天,Cursor、Claude Code、Codex、OpenCode 等工具各有拥趸。然而,这些工具的 Skills 管理往往各自为战,导致技能分散、重复安装、维护困难。SkillsLM 是一款开源桌面端管理…
OceanBase 发布 AI 数据库:Agent 时代的企业数据底座
随着企业级 AI Agent 的加速落地,数据管理与架构成为了新的核心痛点。OceanBase 最近发布的 AI 数据库方案,旨在通过统一的底座解决企业数据分散、权限隔离等问题,为真正的智能应用提供支撑。
企业 Agent的落地就在 AI …
Agent Eval 系统构建指南:概念、评估方法与落地路线
如果你在做 AI Agent,迟早会遇到一个的问题:用户说“这个版本好像变差了”,但你很难说清楚到底差在哪里。
是模型能力退步了?Prompt 改坏了?工具调用路径变长了?某个边界 case 被破坏了?还是只是一次随…
Anthropic封号潮应对:构建可替换的AIOS系统架构
这两天 claude 的封号潮又来了,被爆出来专门植入代码识别中国用户,大家的反应画风也是相当割裂。
几年老用户 Max 号说封就封,一些 IP 粉转黑疯狂输出情绪,并开始报复性给替代模型引流;
A\封完账号转头宣布 Fable5 解封,幸…
Skill Zoo:开源一站式 Agent 技能管理工具,支持 SSOT 与多平台同步
给所有流浪的技能宝宝一个家
自 Coding Agent 爆火以来,Agent 技能作为其能力的重要载体也备受关注。 Agent 技能本质上是文档,但凭借其可插拔、任务间通用和渐进式披露等特性,已经变成了 prompt 的一…
别急着搞 Loop Engineering:大多数人还没到需要它的阶段
最近 Loop Engineering 概念在 AI 开发圈爆火。各种文章都在宣传 Loop 的强大之处——AI 自动执行、自动检查、自动迭代,用户只需设定目标就能离开。有人用它六天重写代码库,有人一个月自动提交 2…
QClaw多Agent协作实测:3个智能体接力完成复杂数据分析任务
腾讯 QClaw(龙虾)支持多 Agent 协作,可以实现复杂办公任务的自动化。本文实测了一套三步数据分析流程:5 个上万行 Excel 文件,先由高级数据分析师做跨表分析,再由数据审计 Agent 复核结论,最后由报告生成 Agent 输…