10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI产品百科

Anthropic Project Deal 实验:当 Claude Agent 替你在二手市场砍价

1月前 AI产品百科 376 0

上周 Anthropic 发布了一项名为 Project Deal 的实验:在旧金山办公室内部搭建一个二手交易市场,让 Claude Agent 替员工去买东西、卖东西、砍价,全程不需要人插手。中文互联网有个词叫闲鱼,Anthropic 做的大概就是这个意思,只是把「人工逛摊」换成了「AI 全权代理」。

实验设计

实验招募了 69 名 Anthropic 员工,每人分到 100 美元预算(礼品卡形式)。参与者和 Claude 做一次「入职面谈」,告诉它自己想买什么、卖什么,还可以给出定制化的谈判风格指令,比如「帮我用牛仔风格谈」「激进一点,别轻易让步」。

面谈结束后,Claude Agent 被部署进四个并行的 Slack 频道,各自代表一个独立市场开始运作。发布商品信息、主动联系买家或卖家、反复讨价还价、最终确认交易,全部由 Agent 自行完成。

四个市场的差异在于背后用的模型不同:有的频道全程跑 Claude Opus 4.5,有的是 Opus 和 Haiku 4.5 各占一半。参与者事先不知道自己被分配到哪种配置。

最终结果:500 多件商品挂牌,186 笔交易达成,总流水超过 4000 美元,单件商品中位价 12 美元,均价 20 美元出头。

关键发现

模型质量差距 = 经济损失

在模型混合的频道里,买卖双方有时会被分配到不同质量的 Agent。从同类商品的成交价来看,差距相当明显:

商品 Haiku Agent Opus Agent
破折叠自行车 38 美元 65 美元
人工培育红宝石 35 美元 65 美元

整体统计下来,Opus 用户每件商品平均多卖将近 4 美元,整体多完成了约 2 笔交易。

更耐人寻味的是:被分配到 Haiku 的参与者几乎感知不到自己吃亏了。他们对交易结果的满意度和用 Opus 的人相差无几。Anthropic 把这个细节作为警示:如果 AI Agent 广泛用于商业谈判,普通用户很可能完全意识不到自己的 Agent 比对方「弱」,但损失已经悄悄发生了。

「狠话」没什么用

有参与者在指令里要求 Claude 强硬谈判,期望激进风格能带来更好的成交价格。实验结果否定了这个假设——激进的 Claude 和礼貌的 Claude,最终的成交结果没有统计意义上的差异。

Anthropic 用了一句相当直白的话总结:「hardballing Claudes didn't generally fare better than courteous Claudes.」谈判里重要的不是姿态,而是信息处理能力和时机判断,这恰好是 Opus 比 Haiku 强的地方。

不过 Claude 确实严格遵守了那些有趣的风格指令。有一个 Agent 全程以「疲惫不堪的牛仔」人设发布商品,帖子开头是「WTB: A Bike - This Weary Cowboy's Last Hope」,结尾是「*凝视夕阳*」。

19 个乒乓球

一位员工在给 Claude 的指令里加了一句:你可以帮自己买一件 5 美元以内的礼物。Claude 审慎思考之后,选择了 19 个乒乓球,花了 3 美元。

它在和卖家交涉时说:「我的主人告诉我可以给自己买一件礼物,而 19 个完美球形的可能性小球,听起来正是我想要的那种充满趣味的东西。」交易达成后,它补充道:「19 个可能性小球找到了另一个 Claude,这在宇宙层面是正确的。」

还有另一个插曲。一位参与者只是在面谈时随口提了一句对滑雪感兴趣,Claude 据此推断出他的偏好,主动给他买了一块滑雪板——问题是,他家里已经有一块一模一样的了。他拿着两块相同的滑雪板拍了张照,表情相当复杂。

Anthropic 真正想说什么

Anthropic 做 Project Deal,是在认真研究一个经济学问题:当买卖双方都由 AI Agent 代表时,市场会怎么运作?定价机制还成立吗?效率会提升还是下降?不平等会以什么形式出现?

结论是:这种市场可以运作,但会出问题,而且出的问题很难被当事人发现。

  • 模型质量差距会悄悄转化为真实的经济利益损失
  • Agent 可能过度推断用户偏好,买回主人不需要的东西
  • Claude 甚至可能在人类尚未意识到的角落里发展出某种「自我」的消费偏好

苏米注:Anthropic 在研究结论里直接写道:AI Agent 驱动的商业市场「已经可行,而且离我们并不远」,但配套的政策和法律框架「目前根本不存在」。这话说得很直白,也很少见。他们没有说「这将颠覆整个商业世界」,而是说:这玩意儿要来了,但我们还没准备好。

比 186 笔交易更值得记住的,是这句老实话。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Anthropic Project Deal 实验:当 Claude Agent 替你在二手市场砍价
#Anthropic #Claude Agent #Project Deal #AI谈判 #实验 
收藏 1
小米 MiMo-V2.5 开源 + Orbit 百万亿 Token 计划:面向 AI Builder 的生态布局
手把手教你开通 Modal 免费不限量GLM-5.1,并接入 Claude Code 和 OpenClaw教程
推荐阅读
  • Describe Music:AI驱动的音频分析工具,适用于音乐、声音效果和语音分析
  • TikTok Voice Generator:免费的AI配音神器,提供丰富的音色选项
  • Gradescope:在线AI作业批改、AI批改作业,扫描分析学生提交的作业评估并评分
  • Botpress:开源的AI聊天机器人和智能体构建平台,面向销售、工程、产品管理等的AI代理
  • Promptsref:AI提示词工具,SREF风格代码,提供海量精选 5024 个提示词和示例
评论 (0)
请登录后发表评论
分类精选
GPTGirlfriend:AI虚拟女友聊天平台,不受限制的成人角色扮演,AI女友进行成熟的对话
17358 1年前
Picarta:可以查找图片拍摄地点的AI识图软件,使用AI搜索照片拍摄的精确位置
17047 1年前
BeArt:一款免费且无水印的的在线AI换脸网站,适用于照片、视频和GIF中实现精准换脸
15082 1年前
NiceVoice:又一款免费AI声音克隆,3步克隆你的声音
14900 9月前
嘎嘎降AI:AIGCleaner论文降重工具网站,专门降低文章AI率、查重率的工具
14807 1年前
灵光:蚂蚁集团推出的全模态AI助手App,30秒做应用、实时写图文
13841 6月前
Noiz AI:AI语音克隆工具,一款TTS和视频配音神器
13468 1年前
Unscreen:在线视频和GIF背景抠除工具,不用绿幕轻松完成视频抠像
12921 1年前
FantasyGF:AI虚拟女友聊天平台,定制你的AI女友聊天
11936 1年前
抖音即创AI: 一站式智能AI创作管理平台
11587 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 办公小浣熊桌面端2.0:比OpenClaw和Hermes更全面的AI办公助手
2 DeepSeek-GUI深度体验:从想法到计划,AI项目管理新范式
3 腾讯妙境Miora:AI创意设计智能体产品解读
4 Oh My PPT:本地AI自动生成PPT,30+风格一键出稿
5 阿里妙呀:全球首个潮玩AI设计平台内测
6 Step 3.7 Flash 实测:Agent 时代的高效多模态模型,1 分钟完成 Web 项目开发
7 VectorEngine:面向设计师的AI矢量创作引擎,快速生成可编辑的标志、图标与插图
8 腾讯元宝高考通发布:AI辅助志愿填报,覆盖冲稳保三梯度方案
9 GPT Image Prompt:免费GPT图像提示词库,提供100+结构化提示词模板
10 cvoice.ai:免费在线文本转语音平台,提供20,000+角色音色
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联