#Agent测评

5 款主流 AI 模型 Agent 任务实测:MiniMax、DeepSeek、Step、GLM、Gemini 对比
市面上能调用的模型越来越多,各家都有自己的亮点,光看宣传文档和跑分数据很难判断哪个真正适合自己——尤其是当任务从单轮对话延伸到多步操作的时候。这次测试把五个主流模型拉出来实际跑一遍,看看它们在真实 Agent 任务中…