一个模型搞定动作生成与估计,颠覆游戏动作建模! 点击:16 | 回复:0



qahuxinglin

    
  • 精华:0帖
  • 求助:0帖
  • 帖子:6帖 | 0回
  • 年度积分:0
  • 历史总积分:0
  • 注册:2011年3月29日
发表于:2025-07-02 01:07:48
楼主

实验结果和应用

GENMO 在多个任务上“大秀肌肉”:

视频到动作:从动态相机视频中估计全局动作,在 EMDB 和 RICH 数据集上吊打对手。

音乐到舞蹈:生成的舞蹈动作多样性高,还能紧跟节奏。

文本到动作:输入“一个人跑步然后跳跃”,它就能生成对应的动作序列。

动作中间帧:给几个关键帧,它能补齐中间的动作,流畅得像电影。

这些能力让 GENMO 在现实中大有可为。比如,游戏开发者可以用它快速生成角色动作,电影制作人可以用它设计复杂的舞蹈场面,VR 开发者可以用它打造更真实的虚拟体验。

未来展望

GENMO 虽然很强,但还有进步空间。目前,它依赖外部 SLAM 方法来获取视频的相机参数,未来可以把这部分集成进来。它现在只支持全身动作,研究团队计划加入面部表情和手部细节,让虚拟人物更“活”。

想象一下,未来的 GENMO 能让你的游戏角色不仅跑得自然,还能边跑边笑,甚至手势都惟妙惟肖,这将是动作建模领域的一大飞跃。

NVIDIA 的 GENMO 就像动作建模界的“变形金刚”,把估计和生成两大任务合为一体,用一个模型解决所有问题。它不仅性能顶尖,还能灵活应对各种输入,为游戏、动画和虚拟现实打开了新大门。GENMO 的出现,标志着人类动作建模迈向了一个更智能、更统一的时代。




楼主最近还看过


热门招聘
相关主题

官方公众号

智造工程师