10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

微软王炸开源 TRELLIS.2!如何改变 3D 生成的交付方式?

3小时前 AI最新动态 11 0

作为经常体验各类 AI 工具的产品经理,我见过不少 Image-to-3D 的解决方案。它们通常要么生成精度不足,要么后处理复杂,要么材质支持有限。但微软最近开源的 TRELLIS.2,在这几个维度上的表现让我重新审视了这一赛道的现状——它不再是"AI 艺术实验",而是逐步演变为真正可用的3D 资产自动化生产工具。

项目概览

TRELLIS.2 是微软开源的单图像到 3D 模型生成框架,核心能力是在 1 分钟内将一张二维图片转换为带完整 PBR 材质的游戏级 3D 资产。

生成的模型格式为 .glb,可直接导入 Blender、Unity、Unreal Engine 等主流 3D 软件,基本无需后处理即可使用。

根据官方数据,在 NVIDIA H100 GPU 上,生成基础质量模型仅需 3 秒(512³分辨率)。

核心功能拆解

1. 三维度的性能均衡

TRELLIS.2 采用 4B 参数规模的 DiT(Diffusion Transformer)架构,但关键优化在于其编码方式:

  • 稀疏 3D VAE + 16 倍空间下采样——将高分辨率 3D 数据压缩到紧凑的潜在空间,降低计算成本的同时保留结构细节
  • 分辨率支持范围:512³ ~ 1536³
  • 生成时间:512³ 约 3 秒、1024³ 约 17 秒、1536³ 约 1 分钟(H100 环境)

2. 拓扑结构处理的突破——O-Voxel 表示法

传统等值面场方法在处理复杂几何时容易失效。TRELLIS.2 引入 O-Voxel 表示法,专门应对以下难点场景:

  • 薄壳结构:衣物褶皱、树叶、纸质物体等低厚度几何
  • 非流形几何:不连续或拓扑复杂的结构
  • 内部结构:物体内部的封闭空间与细节

这意味着生成的模型在几何学上"站得住脚",而非仅在视觉上相似。

3. PBR 材质的完整支持

大多数 3D 生成工具输出单一颜色贴图,容易产生"塑料感"。TRELLIS.2 直接生成 PBR 四通道材质:

  • Base Color(基础颜色)
  • Roughness(粗糙度)
  • Metallic(金属度)
  • Opacity(不透明度/透明通道)

这些参数可直接投入到现代渲染管线,确保物理准确性——生成的玻璃在渲染引擎中真正透明,金属表面确实会反光。

4. 极简的处理流程

从图像到可用资产的完整链路被压缩至极致:

  • 纹理网格 → O 体素:< 10 秒(单核 CPU)
  • O 体素 → 纹理网格:< 100 毫秒(CUDA)
  • 整个工作流无需显式渲染或额外优化步骤

使用方式对比

方案一:在线体验(推荐快速尝试)

微软在 Hugging Face 部署了官方 Space,浏览器即可使用:

地址:https://huggingface.co/spaces/microsoft/TRELLIS.2

操作流程:上传图片 → 点击生成 → 等待 20 秒左右 → 查看 3D 预览 → 下载 .glb 文件

优点:零部署成本,适合快速验证

缺点:受服务端资源限制,可能存在排队

方案二:本地部署(适合批量生成)

环境要求:

  • NVIDIA GPU,显存 ≥ 24GB(推荐 H100 或 A100)
  • CUDA 12.x 环境
  • Python 3.9+

安装步骤:

git clone -b main https://github.com/microsoft/TRELLIS.2.git --recursive
cd TRELLIS.2
./setup.sh --new-env --basic --flash-attn --nvdiffrast --nvdiffrec --cumesh --o-voxel --flexgemm

脚本会自动下载预训练模型(TRELLIS.2-4B)和必要依赖。

代码集成示例

若需在应用中集成 TRELLIS.2,核心流程如下:

import os
import cv2
import imageio
from PIL import Image
import torch
from trellis2.pipelines import Trellis2ImageTo3DPipeline
from trellis2.utils import render_utils
from trellis2.renderers import EnvMap
import o_voxel

# 1. 加载环境贴图(用于渲染预览)
envmap = EnvMap(torch.tensor(
    cv2.cvtColor(cv2.imread('assets/hdri/forest.exr', cv2.IMREAD_UNCHANGED), cv2.COLOR_BGR2RGB),
    dtype=torch.float32, device='cuda'))

# 2. 加载管道
pipeline = Trellis2ImageTo3DPipeline.from_pretrained("microsoft/TRELLIS.2-4B")
pipeline.cuda()

# 3. 读取输入图像并生成
image = Image.open("input.png")
mesh = pipeline.run(image)[0]
mesh.simplify(16777216)  # 面数优化

# 4. 生成预览视频
video = render_utils.make_pbr_vis_frames(render_utils.render_video(mesh, envmap=envmap))
imageio.mimsave("preview.mp4", video, fps=15)

# 5. 导出为 GLB 格式
glb = o_voxel.postprocess.to_glb(
    vertices=mesh.vertices,
    faces=mesh.faces,
    attr_volume=mesh.attrs,
    coords=mesh.coords,
    attr_layout=mesh.layout,
    voxel_size=mesh.voxel_size,
    aabb=[[-0.5, -0.5, -0.5], [0.5, 0.5, 0.5]],
    decimation_target=1000000,
    texture_size=4096,
    remesh=True,
    verbose=True)

glb.export("output.glb", extension_webp=True)

输出说明:

  • preview.mp4:PBR 材质渲染效果预览
  • output.glb:可直接导入 3D 软件的资产文件
  • 透明度处理:Alpha 通道包含在纹理中,但默认以不透明模式导出。若需启用透明效果,需在 3D 软件中手动连接材质的 Alpha 通道

应用场景分析

TRELLIS.2 的实用性主要体现在以下领域:

电商与虚拟陈列:产品图 → 3D 模型 → Web 展示,加速虚拟试衣、家居预览等场景

游戏与数字内容:角色、道具、环境的快速原型生成,缩短前期美术制作周期

VR/AR 应用:实物识别后即时生成交互式 3D 资产

文化遗产数字化:文物照片转 3D 扫描级模型,用于存档与展示

与同类工具的定位差异

当前 Image-to-3D 领域存在多个开源方案。TRELLIS.2 在以下维度的特性值得关注:

维度 TRELLIS.2 TripoSR LRM++
材质输出 完整 PBR 四通道 颜色贴图为主 颜色 + 法线
拓扑处理 O-Voxel(复杂几何) 隐式函数 网格直接生成
生成速度(512³) ~3 秒 ~10-15 秒 ~8-12 秒
最低显存需求 24GB+ 12GB+ 16GB+
开源程度 完全开源 完全开源 权重开源

总结与建议

从产品角度看,TRELLIS.2 代表了 Image-to-3D 这一方向从"实验室"走向"生产环境"的关键节点。它的差异化优势主要体现在三个方面:

  • 材质完整性:PBR 四通道的支持打通了与现代渲染引擎的直接集成路径,减少中间环节
  • 几何鲁棒性:O-Voxel 方法对拓扑复杂结构的处理优于传统隐式方法,输出的模型结构更可靠
  • 推理效率:在同等质量下,3 秒的生成速度为批量处理提供了现实可行性

对有实际落地需求的团队(如电商平台、游戏工作室、XR 内容方),TRELLIS.2 值得作为首选方案进行试验——可从官方 Hugging Face Space 的免费体验开始,验证效果后再考虑本地部署。

开源地址:https://github.com/microsoft/TRELLIS.2

模型权重:https://huggingface.co/microsoft/TRELLIS.2-4B

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:微软王炸开源 TRELLIS.2!如何改变 3D 生成的交付方式?
#TRELLIS.2 #微软开源 
收藏 1
限时免费:GLM‑4.6在 Cline 免费开放,VS Code + Cline上手体验
这是最后一篇
推荐阅读
  • Cursor推出Ultra 计划!Cursor Pro 不限请求次数了!
  • GPT-5 Codex 来了:比 Claude Code 更专业的编程伙伴?
  • FLUX.2 发布:多参考一致性和文本渲染的明显提升,把图像生成放进生产流程,附官方提示词指南
  • Meta宣布彻底解决RAG最大痛点:速度提升30倍,上下文窗口暴增16倍,成本直接腰斩!
  • 不是Cursor,甚是Cursor!Google AI Studio 大焕新!
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
22151 5月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
20769 7月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
14627 9月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
14008 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
12893 8月前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
12465 8月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
11965 8月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
10664 9月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
9463 1年前
Trae Pro 来了,终于可以告别排队了!这价格真香
7482 6月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 微软王炸开源 TRELLIS.2!如何改变 3D 生成的交付方式?
2 限时免费:GLM‑4.6在 Cline 免费开放,VS Code + Cline上手体验
3 扣子Coze重磅上线「扣子编程」,智能体、工作流、网页应用,移动应用通通都是一句话搞定!
4 Gemini 3 Flash 正式发布,比国产 AI 更便宜,免费、极速、吊打前代
5 小米发布MiMo V2 Flash模型,而且支持免费接入 Claude Code
6 Wan 2.6:角色与音色可参考,多镜头更稳定,短视频制作更可控
7 智谱一周连续开源8个项目,GLM-4.6V 视觉模型才最大功臣
8 n8n 2.0 来了,到底改了什么?升级迁移项目该怎么做?
9 Ovis-Image:7B参数文生图模型终结乱码,吊打 GPT-4o AI 生图“文字渲染”新标杆
10 GLM-4.6V重磅开源!9B与106B两档视觉模型的本地与云端实测
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联