nexus/wiki/concepts/AI图生视频.md at 8c909c9c0890da1f775aba2c27583e50916074d7 - nexus - Gitea: Git with a cup of tea

ishenwei/nexus

Files

weishen 6f44ff76a2 Auto-sync: 2026-04-23 04:02

2026-04-23 04:02:48 +08:00

2.7 KiB

Raw Blame History

title, type, tags

title

type

tags

AI图生视频

concept

ai

video-generation

image-to-video

Definition

AI图生视频（Image-to-Video）是一种将静态图片通过人工智能模型自动转化为动态视频的技术。模型需要完成运动估计（从静态图像推断可能的运动方向）、时序生成（合成多帧连续画面）、内容填充（生成原图中未显示的视角和细节）三大核心任务。

Aliases

图生视频
Image to Video (I2V)
Img2Vid
AI Video Generation from Image

Core Techniques

运动估计：从单张静态图片推断场景中各元素的运动方向和速度
时序生成：合成帧间连续性，确保视频流畅无闪烁
内容扩展：根据图片上下文填充画面外延区域（如物体背面、背景延续）
主体一致性：在多段视频中保持人物/物体的视觉特征（面部、衣着、颜色）高度一致
音频同步：根据视频内容自动生成匹配的音效或背景音乐

Control Methods

控制方式	描述	代表工具
文本提示词	通过自然语言描述控制运动和场景变化	智谱清影、通义万相、可灵AI
动作模板	预定义的动作序列，用户直接选择	绘蛙AI视频
运镜参数	调整摄像机运动方式（推进/拉远/倾斜/轨道）	即梦AI、Stable Video、Viva
首尾帧	以首帧和尾帧图片约束视频首尾画面	即梦AI、PixVerse
运动笔刷	手动选择图片中需要动态化的区域	艺映AI

Key Capabilities

生成时长：2秒至6秒不等，取决于工具和付费等级
分辨率：720p至1440p，免费工具通常为720p-1024p
生成速度：30秒至数分钟
风格支持：写实、动漫、3D动画、油画、赛博朋克、国风等
音效支持：部分工具（智谱清影）支持AI自动生成匹配音效

Applications

电商场景：模特图动态化（换装展示、动作演示）、商品展示视频
内容创作：创意短片、自媒体视频素材
广告制作：营销视频、产品演示
社交媒体：小红书、抖音、快手短视频素材

AI文生视频：通过文本描述直接生成视频，与图生视频互补
主体一致性：多段视频中保持人物视觉特征一致的技术
运镜控制：摄像机运动参数对视频效果的影响
首尾帧控制：以约束帧控制视频首尾画面的技术

Key Entities

智谱清影：支持音效自动生成的AI视频工具
可灵AI：快手推出的1080p高质量图生视频工具
即梦AI：首尾帧精准控制、多参数自定义
Vidu：清华大学联合发布，主体一致性领先