#多模态
智谱 GLM-5V-Turbo 发布:原生多模态 Coding 基座模型
智谱 GLM-5V-Turbo 发布:原生多模态 Coding 基座模型
2026 年 4 月 2 日,智谱发布 GLM-5V-Turbo,定位为「面向视觉编程的多模态 Coding 基座模型」。这款模型在 GLM-5-Turbo 的编程和…
天谱乐:全球首个文本/图片/视频一键成曲的多模态AI音乐创作大模型
天谱乐是唱鸭旗下的AI音乐品牌,为用户提供个性化、智能化的音乐创作体验。它支持文本、图片和视频生成音乐,让创作变得简单便捷。利用先进的多模态理解与生成技术,天谱乐能够生成与图片和视频情感高度契合的音乐,并提供发行级的歌曲创作服务。无论是专…
SkyReels:一个画布+多Agent的端到端内容生成思路,适合营销与电商团队
把一张猫的头像,从风格化转绘到生成短视频、加配音并导出4K,全程没有跳出同一个画布。
这是我对全新 SkyReels 的第一印象:以“无限画布”为核心,串起图片、视频、数字人、音频等多模态生成,并用一组预设 Agen…
Pixeltable:用表格替代胶水代码,简化多模态AI流水线开发
在过去几个月的产品调研中,我发现许多团队在构建多模态AI应用时都面临一个共同的痛点:需要在数据库、文件存储、向量库、API服务和编排系统之间反复切换,用大量胶水代码维持整个流水线的运转。这种架构不仅开发效率低下,还容易在数据流转过程中引入b…
LongCat-Flash-Omni 正式发布并开源:开启全模态实时交互时代
美团正式发布 LongCat-Flash 系列模型,现已开源 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 两大版本,获得了开发者的关注。
今天 LongCat-Flash 系列再升级,正式发布全新…
智谱开源 GLM-4.5V:全新视觉推理模型,国产 AI 大模型又炸场了!
最近我一直在追踪国产大模型的进展,没想到这次智谱直接上演了一波“连环杀”。 上个月他们开源的 GLM-4.1V-Thinking 刚冲上 HuggingFace Trending 第一,下载量破 13 万。
结果上周…