--- title: 运动控制 type: concept tags: [AI, 视频生成, 运动] last_updated: 2026-04-15 --- ## 定义 运动控制(Motion Control)是通过文本提示词控制视频中主体运动方向和动作的技术能力。 ## 核心机制 - 提示词解析:理解用户输入的文本指令(如"快速转身微笑") - 运动推断:基于图片内容和提示词推断合理的运动轨迹 - 物理约束:遵循真实世界物理规律(如重力、碰撞) ## 技术特点 - 主体+运动+背景:典型提示词结构 - 复杂动作生成:如切西红柿、倒茶等符合物理逻辑的动作 - 情绪动作:皱眉、叹气、翻白眼等复杂情绪表现 - 细节填充:为元素添加合理的运动细节 ## 典型实现 - [[通义万相]]:通过提示词精准控制运动,实现大幅度主体运动 - [[可灵AI]]:3D时空联合注意力机制,生成符合物理逻辑的复杂动作 - [[VideoOcean]]:根据用户指令让图片中主体做出特定动作或表情 - [[海螺AI]]:理解超出图片内容的文本指令,实现"所写即所见" ## Connections - [[运动控制]] ← 属于 ← [[图生视频]] - [[可灵AI]] ← 实现 ← [[运动控制]] - [[通义万相]] ← 实现 ← [[运动控制]]