32 lines
1.2 KiB
Markdown
32 lines
1.2 KiB
Markdown
---
|
||
title: 运动控制
|
||
type: concept
|
||
tags: [AI, 视频生成, 运动]
|
||
last_updated: 2026-04-15
|
||
---
|
||
|
||
## 定义
|
||
运动控制(Motion Control)是通过文本提示词控制视频中主体运动方向和动作的技术能力。
|
||
|
||
## 核心机制
|
||
- 提示词解析:理解用户输入的文本指令(如"快速转身微笑")
|
||
- 运动推断:基于图片内容和提示词推断合理的运动轨迹
|
||
- 物理约束:遵循真实世界物理规律(如重力、碰撞)
|
||
|
||
## 技术特点
|
||
- 主体+运动+背景:典型提示词结构
|
||
- 复杂动作生成:如切西红柿、倒茶等符合物理逻辑的动作
|
||
- 情绪动作:皱眉、叹气、翻白眼等复杂情绪表现
|
||
- 细节填充:为元素添加合理的运动细节
|
||
|
||
## 典型实现
|
||
- [[通义万相]]:通过提示词精准控制运动,实现大幅度主体运动
|
||
- [[可灵AI]]:3D时空联合注意力机制,生成符合物理逻辑的复杂动作
|
||
- [[VideoOcean]]:根据用户指令让图片中主体做出特定动作或表情
|
||
- [[海螺AI]]:理解超出图片内容的文本指令,实现"所写即所见"
|
||
|
||
## Connections
|
||
- [[运动控制]] ← 属于 ← [[图生视频]]
|
||
- [[可灵AI]] ← 实现 ← [[运动控制]]
|
||
- [[通义万相]] ← 实现 ← [[运动控制]]
|