一个模型搞定动作生成与估计，颠覆游戏动作建模！-专业自动化论坛-中国工控网论坛

发表于：2025-07-02 01:07:48

楼主

实验结果和应用

GENMO 在多个任务上“大秀肌肉”：

视频到动作：从动态相机视频中估计全局动作，在 EMDB 和 RICH 数据集上吊打对手。

音乐到舞蹈：生成的舞蹈动作多样性高，还能紧跟节奏。

文本到动作：输入“一个人跑步然后跳跃”，它就能生成对应的动作序列。

动作中间帧：给几个关键帧，它能补齐中间的动作，流畅得像电影。

这些能力让 GENMO 在现实中大有可为。比如，游戏开发者可以用它快速生成角色动作，电影制作人可以用它设计复杂的舞蹈场面，VR 开发者可以用它打造更真实的虚拟体验。

未来展望

GENMO 虽然很强，但还有进步空间。目前，它依赖外部 SLAM 方法来获取视频的相机参数，未来可以把这部分集成进来。它现在只支持全身动作，研究团队计划加入面部表情和手部细节，让虚拟人物更“活”。

想象一下，未来的 GENMO 能让你的游戏角色不仅跑得自然，还能边跑边笑，甚至手势都惟妙惟肖，这将是动作建模领域的一大飞跃。

NVIDIA 的 GENMO 就像动作建模界的“变形金刚”，把估计和生成两大任务合为一体，用一个模型解决所有问题。它不仅性能顶尖，还能灵活应对各种输入，为游戏、动画和虚拟现实打开了新大门。GENMO 的出现，标志着人类动作建模迈向了一个更智能、更统一的时代。

分享到：

邀请回答

回复楼主

楼主最近还看过

热门招聘