--- title: 图生视频 type: concept tags: [AI, 视频生成, 计算机视觉] last_updated: 2026-04-15 --- ## 定义 图生视频(Image-to-Video)是将静态图片通过AI技术转化为动态视频的核心AI任务。 ## 核心机制 - 深度学习图像理解:AI分析静态图片中的内容、元素和艺术风格 - 运动生成:AI推断图片中元素在未来时间序列中的运动轨迹 - 细节填充:AI填充图片中未直接显示但合理存在的细节 - 视频合成:生成连续帧序列,形成平滑动态效果 ## 技术特点 - 输入:静态图片(单张或多张) - 输出:动态视频片段(2-6秒为主) - 关键技术:[[主体一致性]]、 [[运动控制]]、 [[运镜控制]]、 [[风格迁移]] ## 应用场景 - 电商营销:商品展示、模特动态化 - 内容创作:社交媒体短视频 - 广告制作:创意视觉内容生成 - 影视特效:场景动态化、物体拟人化 ## 典型工具 - [[智谱清影]]:30秒生成6秒高清视频,支持风格选择 - [[Vidu]]:多主体参考功能,突破一致性难题 - [[可灵AI]]:物理逻辑动作生成,1080p输出 - [[StableVideo]]:LoRA摄像机精细控制 ## Connections - [[主体一致性]] ← 关键能力 ← [[图生视频]] - [[运动控制]] ← 关键能力 ← [[图生视频]] - [[运镜控制]] ← 关键能力 ← [[图生视频]] - [[风格迁移]] ← 关键能力 ← [[图生视频]]