文章来源:万象ai发布时间:2025-04-04 15:05:40
AI奇点网6月12日报道 |北京百度网讯科技有限公司获得了一项关于生成数字人的专利授权。该专利名为"生成数字人的方法、模型的训练方法、装置、设备和介质",涉及到自然语言处理、深度学习、计算机视觉、图像处理、增强现实和虚拟现实等人工智能技术领域。该专利的应用范围包括元宇宙等多个场景。

专利方案的实现过程如下:
首先,获取素材内容。利用预训练的场景划分模型从素材内容中确定多个场景。每个场景对应素材内容中的一个具有完整语义信息的内容片段。针对每个场景,基于相应的内容片段确定该场景对应的目标内容。根据目标内容确定该场景的场景标签信息。最后,根据场景标签信息配置特定于该场景的数字人。该专利的目的是改善数字人在视频中的应用体验。传统的数字人应用通常基于固定的模板进行,比如播报新闻的数字人。然而,在这种情况下,数字人可能与内容割裂,播报内容与数字人形象不匹配,给用户带来差劲的观看体验。
通过将素材内容按照场景切分并以场景为粒度配置数字人,该专利确保了数字人与场景和目标内容的一致性。这种方法改善了素材内容和数字人之间的融合,提升了用户观看数字人的体验。
该专利的授权对于数字人技术的发展和元宇宙等领域的应用具有重要意义,为提升数字人与场景的一致性和用户体验提供了新的解决方案。

上一篇: 三星电子开始开发大语言模型,旨在提高生产力和减少对第三方AI的依赖
三星电子已经启动了大语言模型(LLM)的开发工作,并计划在7月底完成初期开发,该项目将供内部使用。该项目调动了所有相关的人力和资源。由于GPU在人工智能学习人类语言和数据方面起到关键作用,所有其他内部软件开发组织都被限制使用GPU,并且主要关联公司也成立了人工智能开发小组。
下一篇: 中国电科旗下太极公司发布AI生成式大模型产品“小可”:助力党政企行业智能化转型
中国电科旗下的电科太极公司于6月9日在北京正式发布了生成式人工智能大模型产品"小可"。"小可"旨在为党政企行业提供辅助决策的特种场景支持,助力智能化转型升级。
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25