当前位置：首页 » AI最新动态

ChatGPT Agent 正式发布：OpenAI的"AI打工人"到底有多强？

10小时前 AI最新动态 52 0

昨天晚上，OpenAI 又放了个大招，一场简短的发布会居然发布了一个重量级新功能：ChatGPT Agent。

一开始我也没太放在心上，直到我看到 Sam Altman 本人亲自到场站台，再一看演示内容，顿时明白——这不是简单的“升级”，而是 OpenAI 在向「AI 真正动手干活」的方向跨出了一大步。

作为一个长期关注 AI 工具和产品化落地的产品经理，我最近刚体验过不少国产 Agent 产品，比如 Manus、Genspark、Skywork、MiniMax Agent，这些工具在自动生成 PPT、生成网站、处理 Excel 等垂类应用上已经很有代表性。乍一看，OpenAI 推出的这个 ChatGPT Agent，好像也就那样？

但真看下去，你会发现，这波 OpenAI 玩的是系统级整合——而不仅仅是“能做某个任务”，而是围绕任务流搭建了一整套“AI 打工人”工作体系，彻底打通了「能理解、能分析、能动手」的完整链条。

虽然我还在等Plus会员的使用权限（目前只对Pro用户开放），但通过官方演示和一些网友的实际体验，我想和大家分享一下我的观察和思考。

什么是ChatGPT Agent？

ChatGPT Agent 就是运行在一个虚拟电脑环境中的 AI 助手，它能主动理解你的任务，并调用一整套工具来 完成从头到尾的“打工任务”

ChatGPT Agent这次把ChatGPT的对话能力、Operator的网页操作能力，还有Deep Research的深度调研能力，全部整合到一个虚拟电脑环境里。这就像是给ChatGPT装上了手脚，让它能够真正地"干活"。

你可以直接对它说："帮我查看日历，然后根据最新新闻为即将到来的客户会议做个简报"，或者"帮我制定四人份日式早餐计划，顺便把食材都买好"。听起来是不是很神奇？它会自动浏览网站、筛选信息、运行代码分析，甚至最后给你一个可编辑的PPT或Excel表格。

这些国产的Ai Agent 好像都有了，国内很多 Agent 工具已经能做 PPT、写方案、查资料，甚至一次性生成一个全栈网站。

对比和国内的 AgentOpenAI 的厉害之处：

整合度极高：浏览器、终端、表格、API，一个虚拟机统统接入；
协作流顺滑：它会主动问你细节、适时暂停任务、给出进度摘要，真的像一个“会交流的打工人”；
底层模型做了专项优化：这不是普通 GPT-4.5 而是为 Agent 任务专门打磨过的模型。

再加上它是 OpenAI 官方出的，这意味着一旦打通 API 或商用方案，Agent 就不只是“帮你写点东西”，而是能深度嵌入企业实际流程的 AI 工作者。

核心能力解析

OpenAI为ChatGPT Agent配备了一套相当强大的工具箱：

可视化浏览器：就像人一样点击网页、填表单、进行各种交互操作

文本浏览器：快速处理和理解大量文本信息

终端操作：执行代码、处理文件等后台任务

API连接：直接连接Gmail、GitHub等第三方应用，获取你的日历、邮件等信息

最让我印象深刻的是它的协作式工作流程设计。你可以随时打断它，重新调整任务方向，它会从中断的地方继续，不会丢失之前的进度。这种交互体验确实比传统的AI对话更加自然和高效。

性能表现如何？

从官方公布的基准测试数据来看，ChatGPT Agent的表现确实亮眼：

HLE（Humanity's Last Exam）：通过率达 41.6%，人类专家级题目

FrontierMath：借助终端运行代码，准确率达 27.4%，超越前代所有模型

SpreadsheetBench：直接编辑真实表格的准确率为 45.5%（而 Excel Copilot 只有 20%）

DSBench、投资银行建模：已能完成复杂财务建模、竞品分析等高阶任务

网页浏览 (BrowseComp & WebArena): 在网页信息定位和真实世界网页任务中，Agent同样刷新了SOTA纪录，并超越了前代模型

这些数据看起来很不错，但我更关心的是实际使用体验。

使用门槛

目前，这个功能只对 Team 和 Pro 用户 开始小范围开放（注意，是 200 美元/月的那个 Pro）。普通 Plus 用户可能要再等等。

你只要看到 ChatGPT 聊天界面下方有个“Agent mode”下拉项，就说明你已经可以试用了。

虽然我现在还没用上（普通 Plus 用户），但光是从官方案例和体验视频来看，就已经感受到这玩意的“非同一般”。

总结

ChatGPT Agent的发布，标志着AI应用从对话式交互向任务执行的重大跨越。虽然类似的产品我们之前也见过不少，但OpenAI的入场无疑会加速整个行业的发展进程。

虽然国产 Agent 也在百花齐放，但从系统整合能力和稳定性来看，这波 OpenAI 带来的冲击是实实在在的。

它不只是一个新功能，而是预示着 AI Agent 新的迭代方式出现！

官网介绍：https://openai.com/index/introducing-chatgpt-agent/

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：ChatGPT Agent 正式发布：OpenAI的"AI打工人"到底有多强？

#ChatGPT Agent #ChatGPT #AI Agent #OpenAI

收藏 1

评论 (0)

请登录后发表评论