---
title: "AI图生视频"
type: concept
tags: [ai, video-generation, image-to-video]
---

## Definition
AI图生视频（Image-to-Video）是一种将静态图片通过人工智能模型自动转化为动态视频的技术。模型需要完成运动估计（从静态图像推断可能的运动方向）、时序生成（合成多帧连续画面）、内容填充（生成原图中未显示的视角和细节）三大核心任务。

## Aliases
- 图生视频
- Image to Video (I2V)
- Img2Vid
- AI Video Generation from Image

## Core Techniques
- **运动估计**：从单张静态图片推断场景中各元素的运动方向和速度
- **时序生成**：合成帧间连续性，确保视频流畅无闪烁
- **内容扩展**：根据图片上下文填充画面外延区域（如物体背面、背景延续）
- **主体一致性**：在多段视频中保持人物/物体的视觉特征（面部、衣着、颜色）高度一致
- **音频同步**：根据视频内容自动生成匹配的音效或背景音乐

## Control Methods
| 控制方式 | 描述 | 代表工具 |
|---------|------|---------|
| 文本提示词 | 通过自然语言描述控制运动和场景变化 | 智谱清影、通义万相、可灵AI |
| 动作模板 | 预定义的动作序列，用户直接选择 | 绘蛙AI视频 |
| 运镜参数 | 调整摄像机运动方式（推进/拉远/倾斜/轨道） | 即梦AI、Stable Video、Viva |
| 首尾帧 | 以首帧和尾帧图片约束视频首尾画面 | 即梦AI、PixVerse |
| 运动笔刷 | 手动选择图片中需要动态化的区域 | 艺映AI |

## Key Capabilities
- **生成时长**：2秒至6秒不等，取决于工具和付费等级
- **分辨率**：720p至1440p，免费工具通常为720p-1024p
- **生成速度**：30秒至数分钟
- **风格支持**：写实、动漫、3D动画、油画、赛博朋克、国风等
- **音效支持**：部分工具（智谱清影）支持AI自动生成匹配音效

## Applications
- **电商场景**：模特图动态化（换装展示、动作演示）、商品展示视频
- **内容创作**：创意短片、自媒体视频素材
- **广告制作**：营销视频、产品演示
- **社交媒体**：小红书、抖音、快手短视频素材

## Related Concepts
- [[AI文生视频]]：通过文本描述直接生成视频，与图生视频互补
- [[主体一致性]]：多段视频中保持人物视觉特征一致的技术
- [[运镜控制]]：摄像机运动参数对视频效果的影响
- [[首尾帧控制]]：以约束帧控制视频首尾画面的技术

## Key Entities
- [[智谱清影]]：支持音效自动生成的AI视频工具
- [[可灵AI]]：快手推出的1080p高质量图生视频工具
- [[即梦AI]]：首尾帧精准控制、多参数自定义
- [[Vidu]]：清华大学联合发布，主体一致性领先