空间智能与3D渲染新突破:李飞飞开源AI生成技术,实现高斯泼溅效果与实时交互体验,让3D世界在所有设备上流畅运行

第一段
空间智能领域的“着色器”技术迎来了新的突破!李飞飞创立的空间智能公司World Labs,近期开源了一项核心渲染技术——Forge渲染器。这项技术能够在桌面端、低功耗移动设备以及XR等多平台上实现AI生成3D世界的实时流畅渲染。

第二段
具体而言,Forge是一款基于Web端的高斯泼溅渲染器,无缝集成了three.js框架,支持完全动态和可编程的高斯泼溅操作。其底层经过GPU优化设计,功能类似于传统3D图形领域中的基础组件“着色器”。开发者只需少量代码即可快速启动和运行Forge,同时它还支持多个splat对象、多摄像头视角以及实时动画编辑等功能。World Labs联合创始人Ben Mildenhall表示,这项技术让开发者能够像处理三角形网格一样轻松地操控AI生成的3D世界。

第三段
李飞飞对Forge的表现给予了高度评价,称其“所能做到的事情令人难以置信”。当前,3D高斯溅射(3D Gaussian Splatting)已经成为生成式人工智能与3D重建领域的主流方案。该技术通过将3D场景和对象表示为微小的高斯形状斑点集合,利用机器学习创建出逼真且可实时渲染的3D。

第四段
然而,3D高斯溅射是一项新兴技术,许多传统的基于三角形的3D网格渲染引擎尚无法支持直接渲染。尽管一些库可以在网络上渲染3DGS,但它们通常存在各种限制,例如只能渲染单个3DGS对象、遮挡效果不准确、无法动态修改对象或需要依赖WebGPU等问题。Forge作为一款可编程的3DGS引擎,能够以前所未有的方式控制3DGS的生成、动画以及场景渲染。

第五段
Forge的设计灵感来源于现代3D图形引擎中的着色器图形系统。它允许将函数块(称为Dyno)组合成计算图形,从而程序化地生成和修改Spalt,执行任意计算,并最终转换为GLSL语言在GPU上运行。官网展示的一个菜单场景充分体现了Forge渲染器的实时交互能力。

第六段
实时高斯泼溅渲染的核心挑战之一是对每个splat进行排序,这被称为画家算法(Painter’s algorithm)。Forge系统的核心组件ForgeRenderer负责遍历并编译Three.js场景中所有splat的完整列表。每个ForgeRenderer都有一个默认的ForgeViewpoint,用于从GPU读取所有splat视角列表,并通过高效的bucket sort算法确定绘制顺序。此外,Forge还支持多视角同时渲染,并允许用户在GPU上运行可编程的数据流水线,提供高级功能如刚体变换、颜色编辑和骨骼动画系统等。

第七段
World Labs自成立以来已获得超过2.3亿美元融资,投资方包括a16z、英特尔和AMD等知名企业。他们的目标是将多模态AI从二维像素平面提升至完整的三维世界,并计划于2025年推出首款产品。除了Forge渲染器外,World Labs还计划开发一系列面向艺术家、设计师、开发者、电影制作人和工程师的专业工具,目标客户涵盖视频游戏开发商到电影工作室等多个领域。

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...