文章来源:万象ai发布时间:2025-04-10 15:46:52
AnimeGamer 是腾讯PCG ARC实验室和香港城市大学联合推出的多模态大语言模型项目。它通过语言指令生成动态动画片段,模拟动漫角色的互动与游戏世界。玩家可实时更新角色状态,体验多轮交互,感受沉浸式动漫生活。AnimeGamer只要应用在游戏、故事创作、教育等场景上。

动态动画生成:能够生成动态动画片段,展示角色的动作和行为。
角色状态更新:系统会根据游戏状态更新角色的体力、社交和娱乐值。
多轮交互:支持多轮游戏状态生成,玩家可以通过语言指令与游戏世界进行持续互动。
上下文一致性:生成的游戏状态在视觉和语义上保持一致性,确保玩家的沉浸感。
动画片段编码与解码:使用动画片段编码器将动画片段编码为动作感知的多模态表示,然后通过基于视频扩散模型的解码器将这些表示解码为高质量的视频片段。
游戏状态预测:利用 MLLM 预测每个游戏状态的多模态表示,输入包括历史动画片段表示和当前指令。MLLM 输出包括动态动画片段和角色状态更新。
解码器自适应训练:通过自适应训练阶段,优化解码器以生成高质量的视频片段,减少生成视频中的伪影。

动漫角色互动游戏:玩家可以扮演动漫电影中的角色,通过语言指令与游戏世界互动。
故事创作与可视化:可用于创作和可视化故事,生成连贯的动画片段,支持多轮交互。
教育与培训:在教育和培训场景中,可以生成动态的模拟环境,帮助学生更好地理解和参与学习内容。
娱乐与互动体验:可用于开发新的娱乐和互动体验,如虚拟现实(VR)和增强现实(AR)应用。

1. 下载AnimeGamer和Mistral-7B的检查点,并保存在./checkpoints文件夹中。
2. 设置推理环境,运行以下命令:
gitclonehttps://github.com/TencentARC/AnimeGamer.gitcdAnimeGamercondacreate-nanimegamerpython==3.10-ycondaactivateanimegamerpipinstall-rrequirements.txt3. 生成动作感知的多模态表示并更新角色状态:
pythoninference_Decoder.py4. 修改./game_demo中的指令来自定义游戏体验。
项目主页:https://howe125.github.io/AnimeGamer.github.io
GitHub:https://github.com/TencentARC/AnimeGamer
模型:https://huggingface.co/TencentARC/AnimeGamer
论文:https://arxiv.org/abs/2504.01014
上一篇: DiffPortrait360:一种能够从单张人物肖像图像生成完整一致的360度头部视图的方法
DiffPortrait360是一种3D头部视图生成技术,能够从单张人物肖像照片中生成360度的全方位头部图像。这项技术通过结合预训练的潜在扩散模型和多个辅助模块,实现了高质量、风格化的3D头部视图合成。
下一篇: Genspark Super Agent:Genspark推出的通用型AI智能体,具备全链路任务执行能力
Genspark Super Agent 是一款由AI搜索公司Genspark AI推出的通用型AI智能体。它具备全链路任务执行能力,可完成旅游规划、食谱生成等多样化任务,并支持多模态交互。
相关攻略 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
最新资讯 更多
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
更新时间:2025-07-25
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
更新时间:2025-07-25
Cursor+Claude的SVG图片生成功能,强到离谱,强烈建议写PPT没思路的时候买个会员
更新时间:2025-07-25
超20万人使用!最强开源浏览器Workflow插件【内置3300+模版】效率又起飞了~
更新时间:2025-07-25
营销获客AI公司Clay,花7年找到PMF后,快速实现10倍增长的秘密
更新时间:2025-07-25
5天连发5个王炸!MiniMax这波发布周把OpenAI都整懵了|MiniMax发布周回顾
更新时间:2025-07-25
AI应用行业全景洞察丨中国丨2025年5月丨万字诚作丨Xsignal
更新时间:2025-07-25
数字疗法AI医疗独角兽SwordHealth再融4000万,估值冲至40亿美元背后的战略棋局
更新时间:2025-07-25
宁德时代领投,「银河通用」完成超10亿元新一轮融资
更新时间:2025-07-25
【译】万字长文解读:生成式AI的21个设计模式、示例及应用策略
更新时间:2025-07-25