--- title: "AI图生视频" type: concept tags: [ai, video-generation, image-to-video] --- ## Definition AI图生视频(Image-to-Video)是一种将静态图片通过人工智能模型自动转化为动态视频的技术。模型需要完成运动估计(从静态图像推断可能的运动方向)、时序生成(合成多帧连续画面)、内容填充(生成原图中未显示的视角和细节)三大核心任务。 ## Aliases - 图生视频 - Image to Video (I2V) - Img2Vid - AI Video Generation from Image ## Core Techniques - **运动估计**:从单张静态图片推断场景中各元素的运动方向和速度 - **时序生成**:合成帧间连续性,确保视频流畅无闪烁 - **内容扩展**:根据图片上下文填充画面外延区域(如物体背面、背景延续) - **主体一致性**:在多段视频中保持人物/物体的视觉特征(面部、衣着、颜色)高度一致 - **音频同步**:根据视频内容自动生成匹配的音效或背景音乐 ## Control Methods | 控制方式 | 描述 | 代表工具 | |---------|------|---------| | 文本提示词 | 通过自然语言描述控制运动和场景变化 | 智谱清影、通义万相、可灵AI | | 动作模板 | 预定义的动作序列,用户直接选择 | 绘蛙AI视频 | | 运镜参数 | 调整摄像机运动方式(推进/拉远/倾斜/轨道) | 即梦AI、Stable Video、Viva | | 首尾帧 | 以首帧和尾帧图片约束视频首尾画面 | 即梦AI、PixVerse | | 运动笔刷 | 手动选择图片中需要动态化的区域 | 艺映AI | ## Key Capabilities - **生成时长**:2秒至6秒不等,取决于工具和付费等级 - **分辨率**:720p至1440p,免费工具通常为720p-1024p - **生成速度**:30秒至数分钟 - **风格支持**:写实、动漫、3D动画、油画、赛博朋克、国风等 - **音效支持**:部分工具(智谱清影)支持AI自动生成匹配音效 ## Applications - **电商场景**:模特图动态化(换装展示、动作演示)、商品展示视频 - **内容创作**:创意短片、自媒体视频素材 - **广告制作**:营销视频、产品演示 - **社交媒体**:小红书、抖音、快手短视频素材 ## Related Concepts - [[AI文生视频]]:通过文本描述直接生成视频,与图生视频互补 - [[主体一致性]]:多段视频中保持人物视觉特征一致的技术 - [[运镜控制]]:摄像机运动参数对视频效果的影响 - [[首尾帧控制]]:以约束帧控制视频首尾画面的技术 ## Key Entities - [[智谱清影]]:支持音效自动生成的AI视频工具 - [[可灵AI]]:快手推出的1080p高质量图生视频工具 - [[即梦AI]]:首尾帧精准控制、多参数自定义 - [[Vidu]]:清华大学联合发布,主体一致性领先