分层建模助力3D人体生成,港科广研究成果实现高保真重建细节直逼亚毫米级——CVPR 2025重点论文解读

整理后的

#(由多段落组成)

3D人体生成领域,细节的精确度一直是研究者们追求的目标。近日,香港科技大学广州分校的研究团队提出了一种名为MultiGO的新方法,成功实现了亚毫米级的细节捕捉。这项研究成果已被CVPR 2025接收,并且项目代码即将开源。

MultiGO的核心理念是将人体结构分为多个精度层级,从基础体型到衣物褶皱逐步细化。这种方法类似于搭建乐高积木:先用大模块构建整体框架,再通过小零件补充细节,最后处理材质纹理。这样的分层建模方式不仅提高了模型的准确性,还显著提升了细节表现力。

传统的单目图像三维人体重建方法存在深度歧义性的问题,通常依赖于预训练模板(如SMPL-X)提供几何先验。然而,这些方法往往难以捕捉到细节特征和特定解剖学结构,例如骨骼、关节以及面部皱纹等。为了解决这一问题,MultiGO提出了三级几何学习框架:

1. 骨架增强模块:通过将3D傅里叶特征投影到2D空间,并结合SMPL-X人体网格作为几何先验,增强了人体骨架建模的准确性。傅里叶空间位置编码技术进一步提升了3D模型与2D图像之间的语义对齐能力。

2. 关节增强策略:在训练过程中对关节点位置施加扰动,从而提高模型对深度估计误差的鲁棒性。这种数据增强方式使模型能够更好地适应实际观测中的结构偏差。

3. 皱纹优化模块:采用类似扩散模型去噪的方法,将表面皱纹视为可优化的噪声模式。通过这种方式,可以从粗糙的人体网格中恢复出更精细化的高频细节。

这三个层级模块协同工作,形成了从宏观姿态到微观特征的递进式优化链条。最终输出的3D人体模型不仅具有准确的拓扑结构,还具备丰富的表面细节。

在CustomHuman和THuman3.0两个测试集上,MultiGO的表现远超现有技术。例如,在CustomHuman数据集上,倒角距离(CD)提升了0.180/0.406,法向一致性(NC)提高了0.034,f-score增加了6.277。而在THuman3.0数据集上,CD指标提升了0.355/0.369,NC提高了0.047,f-score大幅提升了9.861。

MultiGO的应用场景非常广泛,包括虚拟试衣、时尚电商、游戏与元宇宙角色生成以及影视特效等领域。例如,在虚拟试衣中,消费者只需上传一张全身照片即可生成高保真的3D人体模型,系统能够自动模拟不同服装的穿着效果,支持360度查看。此外,在游戏与元宇宙中,用户可以通过单张照片快速创建个性化的3D虚拟形象,分层结构支持灵活调整(如更换发型、配饰等),显著降低了美术资源的生产成本。

如果您想了解更多关于MultiGO的信息,可以访问以下链接:
– 论文链接:[https://arxiv.org/pdf/2412.03103](https://arxiv.org/pdf/2412.03103)
– 项目链接:[https://multigohuman.github.io/](https://multigohuman.github.io/)

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...