56 lines
2.8 KiB
Markdown
56 lines
2.8 KiB
Markdown
---
|
||
title: "AI图生视频"
|
||
type: concept
|
||
tags: [ai, video-generation, image-to-video]
|
||
---
|
||
|
||
## Definition
|
||
AI图生视频(Image-to-Video)是一种将静态图片通过人工智能模型自动转化为动态视频的技术。模型需要完成运动估计(从静态图像推断可能的运动方向)、时序生成(合成多帧连续画面)、内容填充(生成原图中未显示的视角和细节)三大核心任务。
|
||
|
||
## Aliases
|
||
- 图生视频
|
||
- Image to Video (I2V)
|
||
- Img2Vid
|
||
- AI Video Generation from Image
|
||
|
||
## Core Techniques
|
||
- **运动估计**:从单张静态图片推断场景中各元素的运动方向和速度
|
||
- **时序生成**:合成帧间连续性,确保视频流畅无闪烁
|
||
- **内容扩展**:根据图片上下文填充画面外延区域(如物体背面、背景延续)
|
||
- **主体一致性**:在多段视频中保持人物/物体的视觉特征(面部、衣着、颜色)高度一致
|
||
- **音频同步**:根据视频内容自动生成匹配的音效或背景音乐
|
||
|
||
## Control Methods
|
||
| 控制方式 | 描述 | 代表工具 |
|
||
|---------|------|---------|
|
||
| 文本提示词 | 通过自然语言描述控制运动和场景变化 | 智谱清影、通义万相、可灵AI |
|
||
| 动作模板 | 预定义的动作序列,用户直接选择 | 绘蛙AI视频 |
|
||
| 运镜参数 | 调整摄像机运动方式(推进/拉远/倾斜/轨道) | 即梦AI、Stable Video、Viva |
|
||
| 首尾帧 | 以首帧和尾帧图片约束视频首尾画面 | 即梦AI、PixVerse |
|
||
| 运动笔刷 | 手动选择图片中需要动态化的区域 | 艺映AI |
|
||
|
||
## Key Capabilities
|
||
- **生成时长**:2秒至6秒不等,取决于工具和付费等级
|
||
- **分辨率**:720p至1440p,免费工具通常为720p-1024p
|
||
- **生成速度**:30秒至数分钟
|
||
- **风格支持**:写实、动漫、3D动画、油画、赛博朋克、国风等
|
||
- **音效支持**:部分工具(智谱清影)支持AI自动生成匹配音效
|
||
|
||
## Applications
|
||
- **电商场景**:模特图动态化(换装展示、动作演示)、商品展示视频
|
||
- **内容创作**:创意短片、自媒体视频素材
|
||
- **广告制作**:营销视频、产品演示
|
||
- **社交媒体**:小红书、抖音、快手短视频素材
|
||
|
||
## Related Concepts
|
||
- [[AI文生视频]]:通过文本描述直接生成视频,与图生视频互补
|
||
- [[主体一致性]]:多段视频中保持人物视觉特征一致的技术
|
||
- [[运镜控制]]:摄像机运动参数对视频效果的影响
|
||
- [[首尾帧控制]]:以约束帧控制视频首尾画面的技术
|
||
|
||
## Key Entities
|
||
- [[智谱清影]]:支持音效自动生成的AI视频工具
|
||
- [[可灵AI]]:快手推出的1080p高质量图生视频工具
|
||
- [[即梦AI]]:首尾帧精准控制、多参数自定义
|
||
- [[Vidu]]:清华大学联合发布,主体一致性领先
|