1.2 KiB
1.2 KiB
title, type, tags, last_updated
| title | type | tags | last_updated | |||
|---|---|---|---|---|---|---|
| 运动控制 | concept |
|
2026-04-15 |
定义
运动控制(Motion Control)是通过文本提示词控制视频中主体运动方向和动作的技术能力。
核心机制
- 提示词解析:理解用户输入的文本指令(如"快速转身微笑")
- 运动推断:基于图片内容和提示词推断合理的运动轨迹
- 物理约束:遵循真实世界物理规律(如重力、碰撞)
技术特点
- 主体+运动+背景:典型提示词结构
- 复杂动作生成:如切西红柿、倒茶等符合物理逻辑的动作
- 情绪动作:皱眉、叹气、翻白眼等复杂情绪表现
- 细节填充:为元素添加合理的运动细节
典型实现
- 通义万相:通过提示词精准控制运动,实现大幅度主体运动
- 可灵AI:3D时空联合注意力机制,生成符合物理逻辑的复杂动作
- VideoOcean:根据用户指令让图片中主体做出特定动作或表情
- 海螺AI:理解超出图片内容的文本指令,实现"所写即所见"