文章来源:08AI导航网发布时间:2025-04-09 16:18:49
LHM是由阿里巴巴通义实验室提出的用于从单张图像重建可动画化3D人体模型的技术。解决从单张图像重建3D人体时的几何、外观和变形解耦问题,通俗地讲,也就是只需提供一张照片,几秒钟就可创建出一个3D人体模型,这个人体模型可以做各种动作,衣服、头发、面部等细节保持的很好,效果看起来非常逼真。
多模态Transformer架构:
利用多模态Transformer架构,有效编码人体位置特征和图像特征。
通过注意力机制保留细节,尤其是衣物的几何形状和纹理。
头部特征金字塔编码方案:
提出头部特征金字塔编码方案,聚合头部区域的多尺度特征。
提升面部身份的保留和细节恢复能力。
3D高斯绘制(Gaussian Splatting):
将3D人体表示为高斯绘制,支持实时、逼真的渲染和姿态控制的动画。
输入图像:从输入图像中提取身体和头部的图像标记(tokens)。
多模态Transformer融合:利用提出的 Multimodal Body-Head Transformer (MBHT) 将3D几何身体标记与图像标记融合。
解码为高斯参数:经过基于注意力的融合过程后,几何身体标记被解码为高斯参数。
快速重建:LHM 能够在数秒内从单张图像中重建出可动画化的3D人体模型,无需后处理。
高精度与泛化能力:在合成数据集和真实场景数据集上的实验表明,LHM 在重建精度、泛化能力和动画一致性方面达到了行业领先水平。
面部和手部细节:LHM 能够生成逼真的面部和手部细节,优于现有方法。
快速重建:LHM能够在数秒内从单张图像中重建出可动画化的3D人体模型,无需后处理。
高精度与泛化能力:在合成数据集和真实场景数据集上的实验表明,LHM在重建精度、泛化能力和动画一致性方面达到了行业领先水平。
实时渲染与动画控制:重建的模型支持实时渲染和姿态控制的动画,适用于沉浸式AR/VR等应用场景。
元宇宙:为用户提供个性化的3D虚拟形象,增强虚拟世界的沉浸感。
影视制作:快速生成高质量的3D角色模型,提高制作效率。
游戏开发:创建逼真的3D游戏角色,提升游戏的视觉效果。
GitHub 代码库:https://github.com/aigc3d/LHM
项目主页:https://lingtengqiu.github.io/LHM/
论文:https://arxiv.org/abs/2503.10625
相关攻略 更多
最新资讯 更多
AI眼镜 “百镜大战” 打响!小小米眼镜官方微博上线引发市场热潮,产业链有望迎来快速发展期
更新时间:2025-04-19
新春第一课!自治区科协举办人工智能科普报告会
更新时间:2025-04-19
加速人工智能赛道布局!东莞市政府高规格召开新春第一场新闻发布会
更新时间:2025-04-19
东莞2025年“一号文”发布 聚焦“人工智能+先进制造”
更新时间:2025-04-19
马斯克:无人机和人工智能将主导未来战争 美国要加大投资
更新时间:2025-04-19
法国印度将联合主持AI行动峰会
更新时间:2025-04-19
法印将联合主持AI行动峰会,法媒:法欧希望借此峰会确立自身竞争地位
更新时间:2025-04-18
OpenAI前高管创立的AI公司据称洽谈融资 估值或达200亿美元
更新时间:2025-04-18
谷歌放弃 “不开发武器 AI” 承诺引争议,吴恩达表态支持
更新时间:2025-04-18
外交部:欢迎各国来华出席2025世界人工智能大会
更新时间:2025-04-18