#AI

AI编程的瓶颈不是Prompt:从会用工具到管理工作流的认知跃迁
今天看到一篇文章的导读,标题很有意思:"你和 AI 写代码之间,差的不是 prompt,是一套工作流"。这句话说到点子上了。 Prompt 的幻觉 很多人刚开始用 AI 编程的时候,都会经历同一个阶段:觉得问题出在 prompt 不够好。今…
开源FigEdit:AI图片一键转可编辑PPTX/SVG,17个案例实测还原度90%+
最近终于解决了一个头疼很久的问题——AI 生成的图片无法编辑。 经常用 GPT Image 2、Nano Banana 的朋友都知道,无论是图片流 PPT、信息图、技术架构图还是论文配图,做出来可能就一句话的事,但修…
VoxFlow Studio:一站式AI语音生成平台,支持TTS/克隆/播客/多语言配音
今天发现一个很有意思的 AI 语音平台——VoxFlow Studio。它把 TTS(文本转语音)、声音克隆、播客生成、视频配音、幻灯片制作全部整合到一个平台里,支持 5 种语言、200+ 种预设声音,还能在 10 …
GPT-5.6 宣而不发,Fable 5 归来再禁:出口管制下的模型封锁
OpenAI 发布了迄今最强的模型——GPT-5.6,一口气推出三个型号:Sol、Terra、Luna,灵感来自太阳、地球、月亮。OpenAI 的命名规则也由此确立:数字管代际,名字管档位。 Sol 是旗舰,最贵也…
千问输入法正式上线:阿里双输入法赛马,语音输入成新战场
阿里在输入法赛道上又落了一子。刚刚上线的千问输入法(macOS 版),才是阿里集团层面的正式产品——而非此前引发讨论的 CosyVoice 输入法。两款输入法由阿里旗下不同公司运营,前后一两天内相继上线,形成内部赛马…
hlwy-ai-checker:用统计指纹检测第三方 AI API 是否掺水
第三方 AI API 市场水很深——号称提供 GPT-4、Claude 的渠道,实际背后可能用的是更便宜的模型。开源项目 hlwy-ai-checker 提供了一种检测思路:通过分析大模型在生成"随机数"时的统计指纹…
Loop Engineering 兴起:从手写提示词到 AI 自动化循环工作流
Claude Code 负责人 Boris Cherny 最近公开表示,他已经不再"写提示词"了,而是写"循环"——让循环自动替他去提示 Claude,决定下一步该做什么。几乎同一时间,开源 AI Agent 项目 …
Hermes 上线 MoA 混合 Agent 模式:多模型协作提升任务质量
OpenAI 刚刚发布了 GPT-5.6 的 Sol、Terra、Luna 三个新模型,但对于大多数国内开发者来说,这些高端模型仍然遥不可及。不过,Hermes 团队几小时前上线了一个新方案——MoA(Mixture…
SenseNova-Skills 开源:为 Hermes Agent 装上 PPT、数据分析、深度调研技能
AI Agent 的"能力边界"问题一直是个痛点——装了 Hermes Agent 或 OpenClaw 之后,它能做什么?商汤在 GitHub 开源的 SenseNova-Skills(4.6k Star,MIT …
pixel2motion:AI 驱动的 logo 动效开源工作流,1.1K Star
在品牌设计领域,logo 动效早已不是锦上添花的装饰,而是品牌体验的核心组成部分。但现实问题很突出:专业动效设计师稀缺且昂贵,普通设计师缺乏动效开发能力,开发者又往往不懂设计美学。这就导致大量优秀的设计稿最终只能以静态形式呈现。 开源项目 …