Files
nexus/wiki/concepts/运动控制.md
2026-04-15 08:15:46 +08:00

32 lines
1.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: 运动控制
type: concept
tags: [AI, 视频生成, 运动]
last_updated: 2026-04-15
---
## 定义
运动控制Motion Control是通过文本提示词控制视频中主体运动方向和动作的技术能力。
## 核心机制
- 提示词解析:理解用户输入的文本指令(如"快速转身微笑"
- 运动推断:基于图片内容和提示词推断合理的运动轨迹
- 物理约束:遵循真实世界物理规律(如重力、碰撞)
## 技术特点
- 主体+运动+背景:典型提示词结构
- 复杂动作生成:如切西红柿、倒茶等符合物理逻辑的动作
- 情绪动作:皱眉、叹气、翻白眼等复杂情绪表现
- 细节填充:为元素添加合理的运动细节
## 典型实现
- [[通义万相]]:通过提示词精准控制运动,实现大幅度主体运动
- [[可灵AI]]3D时空联合注意力机制生成符合物理逻辑的复杂动作
- [[VideoOcean]]:根据用户指令让图片中主体做出特定动作或表情
- [[海螺AI]]:理解超出图片内容的文本指令,实现"所写即所见"
## Connections
- [[运动控制]] ← 属于 ← [[图生视频]]
- [[可灵AI]] ← 实现 ← [[运动控制]]
- [[通义万相]] ← 实现 ← [[运动控制]]