kimodo: 一种用于可控3D人体与机器人运动生成的运动学扩散模型
kimodo: 一种用于可控3D人体与机器人运动生成的运动学扩散模型
它解决了什么问题
Kimodo 解决了生成高质量、可控的3D人体与机器人运动的难题。它允许用户通过将自然语言描述与精确的运动学约束相结合,来创建复杂的动画,从而弥补了高层级文本提示与底层物理控制之间的差距。
工作原理
Kimodo 是一种运动学运动扩散模型,是在包含700小时光学动作捕捉的大规模数据集上训练而成的。它能够根据文本提示和一组约束条件,为各种骨架(SOMA, G1, SMPL-X)生成3D运动。这些约束可以包括全身姿态关键帧、末端执行器位置(手/脚)以及地面平面上的2D路径或路标点。
适用人群
该工具专为从事机器人学、计算机动画和物理AI研究与开发的专业人员设计,特别是那些需要生成合成运动数据以训练基于物理的策略,或创建高保真3D动画的人员。
亮点
- 多骨架支持:支持 SOMA, Unitree G1, 和 SMPL-X 骨架。
- 交互式创作:包含一个带有时间轴编辑器的网页版 Demo,用于混合使用文本提示和运动学控制。
- 机器人集成:兼容 MuJoCo 用于可视化,以及 ProtoMotions 用于训练基于物理的策略。
- 全面的基准测试:提供标准化的评估流水线和测试套件,以衡量运动质量和约束遵循情况。
- 灵活的控制:支持多种约束,包括末端执行器控制和2D 根节点轨迹。
Sources
- undefinednv-tlabs/kimodo