kimodo: 一种用于可控3D人体与机器人运动生成的运动学扩散模型

kimodo: 一种用于可控3D人体与机器人运动生成的运动学扩散模型

它解决了什么问题

Kimodo 解决了生成高质量、可控的3D人体与机器人运动的难题。它允许用户通过将自然语言描述与精确的运动学约束相结合，来创建复杂的动画，从而弥补了高层级文本提示与底层物理控制之间的差距。

工作原理

Kimodo 是一种运动学运动扩散模型，是在包含700小时光学动作捕捉的大规模数据集上训练而成的。它能够根据文本提示和一组约束条件，为各种骨架（SOMA, G1, SMPL-X）生成3D运动。这些约束可以包括全身姿态关键帧、末端执行器位置（手/脚）以及地面平面上的2D路径或路标点。

适用人群

该工具专为从事机器人学、计算机动画和物理AI研究与开发的专业人员设计，特别是那些需要生成合成运动数据以训练基于物理的策略，或创建高保真3D动画的人员。

亮点

多骨架支持：支持 SOMA, Unitree G1, 和 SMPL-X 骨架。
交互式创作：包含一个带有时间轴编辑器的网页版 Demo，用于混合使用文本提示和运动学控制。
机器人集成：兼容 MuJoCo 用于可视化，以及 ProtoMotions 用于训练基于物理的策略。
全面的基准测试：提供标准化的评估流水线和测试套件，以衡量运动质量和约束遵循情况。
灵活的控制：支持多种约束，包括末端执行器控制和2D 根节点轨迹。

Sources

undefinednv-tlabs/kimodo