--- title: "AI图生视频" type: concept tags: [ai, video-generation, image-to-video] --- ## Definition AI图生视频(Image-to-Video)是一种将静态图片通过人工智能模型自动转化为动态视频的技术。模型需要完成运动估计(从静态图像推断可能的运动方向)、时序生成(合成多帧连续画面)、内容填充(生成原图中未显示的视角和细节)三大核心任务。 ## Aliases - 图生视频 - Image to Video (I2V) - Img2Vid - AI Video Generation from Image ## Core Techniques - **运动估计**:从单张静态图片推断场景中各元素的运动方向和速度 - **时序生成**:合成帧间连续性,确保视频流畅无闪烁 - **内容扩展**:根据图片上下文填充画面外延区域(如物体背面、背景延续) - **主体一致性**:在多段视频中保持人物/物体的视觉特征(面部、衣着、颜色)高度一致 - **音频同步**:根据视频内容自动生成匹配的音效或背景音乐 ## Control Methods | 控制方式 | 描述 | 代表工具 | |---------|------|---------| | 文本提示词 | 通过自然语言描述控制运动和场景变化 | 智谱清影、通义万相、可灵AI | | 动作模板 | 预定义的动作序列,用户直接选择 | 绘蛙AI视频 | | 运镜参数 | 调整摄像机运动方式(推进/拉远/倾斜/轨道) | 即梦AI、Stable Video、Viva | | 首尾帧 | 以首帧和尾帧图片约束视频首尾画面 | 即梦AI、PixVerse | | 运动笔刷 | 手动选择图片中需要动态化的区域 | 艺映AI | ## Key Capabilities - **生成时长**:2秒至6秒不等,取决于工具和付费等级 - **分辨率**:720p至1440p,免费工具通常为720p-1024p - **生成速度**:30秒至数分钟 - **风格支持**:写实、动漫、3D动画、油画、赛博朋克、国风等 - **音效支持**:部分工具(智谱清影)支持AI自动生成匹配音效 ## Applications - **电商场景**:模特图动态化(换装展示、动作演示)、商品展示视频 - **内容创作**:创意短片、自媒体视频素材 - **广告制作**:营销视频、产品演示 - **社交媒体**:小红书、抖音、快手短视频素材 ## Related Concepts - [[AI文生视频]]:通过文本描述直接生成视频,与图生视频互补 - [[主体一致性]]:多段视频中保持人物视觉特征一致的技术 - [[运镜控制]]:摄像机运动参数对视频效果的影响 - [[首尾帧控制]]:以约束帧控制视频首尾画面的技术 ## Key Entities - [[智谱清影]]:支持音效自动生成的AI视频工具,30秒生成6秒1440×960视频 - [[可灵AI]]:快手推出的1080p高质量图生视频工具 - [[即梦AI]]:字节跳动旗下,首尾帧精准控制、多参数自定义 - [[Vidu]]:清华大学联合生数科技发布,多主体参考功能 - [[绘蛙AI视频]]:阿里巴巴旗下,专注模特图片动态化,动作模板驱动 - [[通义万相]]:阿里巴巴旗下,精确运镜控制和大幅度主体运动 - [[海螺AI]]:MiniMax推出,形象光影高度一致性,电影级特效 - [[万相营造]]:阿里妈妈旗下,电商营销场景,高度还原原图 - [[PixVerse]]:爱诗科技开发,首尾帧生成和角色一致性保持 - [[Video Ocean]]:潞晨科技推出,V2.0版本画质显著提升 - [[Stable Video]]:Stability AI推出,精细摄像机运动控制 - [[Viva]]:智象未来推出,免费产品中质量最高 - [[Haiper]]:免费AI视频生成工具,支持电影/水彩/赛博朋克风格 - [[艺映AI]]:MewXAI团队推出,运动笔刷选择性动态化