明显感觉到一个趋势:AI 的更新节奏已经快到“一周不看就跟不上”的程度。
上周集中上线了一批新的 AI 模型,覆盖聊天、推理、多模态、视频生成、3D 世界构建等多个方向。
我把这 7 个模型统一体验了一轮,按产品形态和能力特点整理成一篇合集,方便你快速扫一眼就知道:
-
谁在卷速度
-
谁在卷多模态
-
谁已经开始往「可交互世界」和「专业级创作」走了
下面逐个来看。
1、Xiaomi MiMo Studio
产品名称:Xiaomi MiMo Studio
简介:
Xiaomi MiMo Studio 是小米推出的在线 AI 聊天与模型体验平台,主打让用户第一时间体验其最新发布的大模型能力。
目前平台内已支持 Xiaomi MiMo-V2-Flash 模型,是小米在轻量、高响应方向上的最新尝试。

功能特色 / 特点:
-
提供网页端即开即用的 AI 聊天体验
-
可直接体验 Xiaomi 最新发布的 MiMo 系列模型
-
偏向速度与实用性的模型调校思路,适合日常问答和轻量推理
项目地址 / 产品地址:
https://aistudio.xiaomimimo.com
2、Gemini 3 Flash
产品名称:Gemini 3 Flash
简介:
Gemini 3 Flash 是谷歌新推出的一款 主打高速、低成本 的 AI 模型,基于 Gemini 3 架构进行优化。
在性能与价格之间,Flash 版本明显走的是「高性价比路线」。

功能特色 / 特点:
-
推理速度快,响应延迟低
-
在多项基准测试中,表现接近甚至超过 Gemini 3 Pro、GPT-5.2 等更大模型
-
支持多模态理解能力
-
已集成至 Google AI Studio 等多个官方平台
项目地址 / 产品地址:
https://aistudio.google.com/
3、Seed1.8
产品名称:Seed1.8
简介:
Seed1.8 是字节跳动推出的 通用 Agent 大模型,定位非常明确:不是只聊天,而是能「干活」。
模型在多模态、搜索、代码和 GUI 操作等方面进行了深度整合。

功能特色 / 特点:
-
支持图文多模态输入
-
集成搜索能力、代码生成与 GUI 交互
-
适用于复杂工作流与自动化任务
-
更偏向 Agent 型使用场景,而非单轮对话
项目地址 / 产品地址:
https://www.volcengine.com/experience/ark?mode=chat&modelId=doubao-seed-1-8-251215
4、万相 2.6
产品名称:万相 2.6
简介:
万相 2.6 是阿里通义推出的 面向专业影视与图像创作 的视频生成模型系列。
从定位上看,它明显不是给「玩玩看」的用户,而是冲着创作者和专业团队去的。

功能特色 / 特点:
-
支持角色扮演能力
-
可通过上传视频 + 提示词生成高质量短片
-
强调电影级运镜、叙事与镜头语言
-
更适合影视、广告、短片创作场景
项目地址 / 产品地址:
https://tongyi.aliyun.com/wan
5、混元世界模型 1.5
产品名称:混元世界模型 1.5(HY WorldPlay 1.5)
简介:
这是腾讯混元团队开源的一款 实时交互式世界生成模型,方向非常明确:
不是生成内容,而是生成「可探索的世界」。

功能特色 / 特点:
-
输入文字或图片即可生成 3D 虚拟世界
-
支持实时交互和自由探索
-
可通过键盘、鼠标或手柄操作
-
在「生成式 3D 世界」方向上非常有代表性
项目地址 / 产品地址:
https://3d.hunyuan.tencent.com
6、GPT Image 1.5
产品名称:GPT Image 1.5
简介:
GPT Image 1.5 是 OpenAI 最新推出的图像生成模型,核心升级点并不在「画得多好」,而在 指令理解与编辑能力。

功能特色 / 特点:
-
更强的指令遵循能力
-
支持只修改指定区域,其余画面保持一致
-
编辑一致性明显提升
-
生成速度比上一代快 4 倍
-
API 成本降低约 20%
项目地址 / 产品地址:
https://chatgpt.com/
7、Seedance 1.5 Pro
产品名称:Seedance 1.5 Pro
简介:
Seedance 1.5 Pro 是字节跳动 Seed 团队推出的 原生音画同步视频生成模型,核心关键词只有一个:同步。

功能特色 / 特点:
-
文本生成高质量视频内容
-
支持多种人声、音效、语言和方言
-
音画同步生成,人物口型与语音高度匹配
-
更适合角色讲述、虚拟人、短视频创作
项目地址 / 产品地址:
https://seed.bytedance.com/zh/seedance1_5_pro
总结
这一周看下来,我最大的感受是:AI 模型正在快速从“能力展示”走向“明确分工”。
不过我想说的是,你不需要追最强,只需要选最适合你场景的那一个。