文章来源:08ai导航网发布时间:2025-08-12 16:25:13
8月12日消息,昆仑万维SkyWorkAI技术发布周于8月11日启动,连续五天每天发布一款模型,覆盖多模态AI核心场景。
今日,昆仑万维带来了自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——「Matrix-Game2.0」,号称是实现了通用场景下的交互式实时长序列生成的世界模型。
并且为促进交互式世界模型领域的发展,「Matrix-Game2.0」全面开源,号称是业内首个在通用场景上实现实时长序列交互式生成的世界模型开源方案。
「Matrix-Game2.0」号称在实时生成和长序列能力上实现了“质的飞跃”。相较于上一版本,2.0版本更加侧重低延迟、高帧率的长序列交互性能,能够以25FPS的速度,在多种复杂场景中稳定生成连续视频内容,且生成时长可扩展至分钟级,大幅提升了连贯性与实用性。
在推理速度显著提升的同时,模型依然保持了对物理规律与场景语义的“精准理解”,支持用户通过简单指令,自由探索、操控并实时构建结构清晰、细节丰富、规则合理的虚拟环境。
昆仑万维还开源了Matrix-3D大模型,从单图像出发,生成高质量、轨迹一致的全景视频,并直接还原可漫游的三维空间,对标李飞飞WorldLabs的生成效果,可实现更大范围的探索空间。
Matrix-3D由以下核心部分组成:
轨迹引导的全景视频生成模块:利用场景Mesh渲染图作为条件输入,训练视频扩散模型生成符合给定相机轨迹的全景视频。提升生成视频在空间结构上的一致性,缓解遮挡错误与图像伪影问题。
双路径可选择的全景3D重建模块:优化路径,对生成的视频进行超分与3DGS优化,获取高质量3D结构。前馈网络路径:基于Transformer直接回归,从生成视频Latent特征快速预测3D几何属性,实现高效重建。
Matrix-Pano数据集:大规模高质量合成数据集,包含116K条带有相机轨迹、深度图和文本注释的静态全景视频序列。
附两个模型的开源地址如下:
https://github.com/SkyworkAI/Matrix-Game
https://github.com/SkyworkAI/Matrix-3D
相关攻略 更多
最新资讯 更多
AI生成游戏,昆仑万维发布并开源Matrix-Game2.0、Matrix-3D模型
更新时间:2025-08-12
Gemini再揽金牌,力压大学学霸,AI数学推理时代来了
更新时间:2025-08-12
谷歌摊牌:Genie 3让你1秒「进入」名画,人人可造交互世界
更新时间:2025-08-12
AI聊天机器人Claude新增跨平台记忆:用户度假归来可追溯上周聊天记录
更新时间:2025-08-12
AI跑分越来越没意义,谷歌说不如让AI一起玩游戏
更新时间:2025-08-12
华为发布AI推理创新技术UCM:可实现高吞吐、低时延推理体验,计划9月开源
更新时间:2025-08-12
编程“学废”了?普渡毕业却只获烤肉店面试,美国IT失业创新高:AI面试成最大屈辱,网友怒称宁愿失业
更新时间:2025-08-12
伯恩斯坦谈北美机器人市场:从形态之争走向解决方案
更新时间:2025-08-12
奥特曼再回应用户吐槽,并宣布Plus用户GPT-5推理额度提至每周3000次
更新时间:2025-08-12
2025 WRC:3天主旨论坛,4张中国面孔,见证一个崛起的智造强国
更新时间:2025-08-12