title, type, tags
| title |
type |
tags |
| AI图生视频 |
concept |
| ai |
| video-generation |
| image-to-video |
|
Definition
AI图生视频(Image-to-Video)是一种将静态图片通过人工智能模型自动转化为动态视频的技术。模型需要完成运动估计(从静态图像推断可能的运动方向)、时序生成(合成多帧连续画面)、内容填充(生成原图中未显示的视角和细节)三大核心任务。
Aliases
- 图生视频
- Image to Video (I2V)
- Img2Vid
- AI Video Generation from Image
Core Techniques
- 运动估计:从单张静态图片推断场景中各元素的运动方向和速度
- 时序生成:合成帧间连续性,确保视频流畅无闪烁
- 内容扩展:根据图片上下文填充画面外延区域(如物体背面、背景延续)
- 主体一致性:在多段视频中保持人物/物体的视觉特征(面部、衣着、颜色)高度一致
- 音频同步:根据视频内容自动生成匹配的音效或背景音乐
Control Methods
| 控制方式 |
描述 |
代表工具 |
| 文本提示词 |
通过自然语言描述控制运动和场景变化 |
智谱清影、通义万相、可灵AI |
| 动作模板 |
预定义的动作序列,用户直接选择 |
绘蛙AI视频 |
| 运镜参数 |
调整摄像机运动方式(推进/拉远/倾斜/轨道) |
即梦AI、Stable Video、Viva |
| 首尾帧 |
以首帧和尾帧图片约束视频首尾画面 |
即梦AI、PixVerse |
| 运动笔刷 |
手动选择图片中需要动态化的区域 |
艺映AI |
Key Capabilities
- 生成时长:2秒至6秒不等,取决于工具和付费等级
- 分辨率:720p至1440p,免费工具通常为720p-1024p
- 生成速度:30秒至数分钟
- 风格支持:写实、动漫、3D动画、油画、赛博朋克、国风等
- 音效支持:部分工具(智谱清影)支持AI自动生成匹配音效
Applications
- 电商场景:模特图动态化(换装展示、动作演示)、商品展示视频
- 内容创作:创意短片、自媒体视频素材
- 广告制作:营销视频、产品演示
- 社交媒体:小红书、抖音、快手短视频素材
Related Concepts
Key Entities
- 智谱清影:支持音效自动生成的AI视频工具
- 可灵AI:快手推出的1080p高质量图生视频工具
- 即梦AI:首尾帧精准控制、多参数自定义
- Vidu:清华大学联合发布,主体一致性领先