Files
nexus/wiki/concepts/运动控制.md
2026-04-15 08:15:46 +08:00

1.2 KiB
Raw Blame History

title, type, tags, last_updated
title type tags last_updated
运动控制 concept
AI
视频生成
运动
2026-04-15

定义

运动控制Motion Control是通过文本提示词控制视频中主体运动方向和动作的技术能力。

核心机制

  • 提示词解析:理解用户输入的文本指令(如"快速转身微笑"
  • 运动推断:基于图片内容和提示词推断合理的运动轨迹
  • 物理约束:遵循真实世界物理规律(如重力、碰撞)

技术特点

  • 主体+运动+背景:典型提示词结构
  • 复杂动作生成:如切西红柿、倒茶等符合物理逻辑的动作
  • 情绪动作:皱眉、叹气、翻白眼等复杂情绪表现
  • 细节填充:为元素添加合理的运动细节

典型实现

  • 通义万相:通过提示词精准控制运动,实现大幅度主体运动
  • 可灵AI3D时空联合注意力机制生成符合物理逻辑的复杂动作
  • VideoOcean:根据用户指令让图片中主体做出特定动作或表情
  • 海螺AI:理解超出图片内容的文本指令,实现"所写即所见"

Connections