nexus/wiki/concepts/AI文生视频.md at 8c909c9c0890da1f775aba2c27583e50916074d7 - nexus - Gitea: Git with a cup of tea

ishenwei/nexus

Files

weishen 6f44ff76a2 Auto-sync: 2026-04-23 04:02

2026-04-23 04:02:48 +08:00

1.3 KiB

Raw Blame History

title, type, tags

title

type

tags

AI文生视频

concept

ai

video-generation

text-to-video

Definition

AI文生视频（Text-to-Video）是一种通过文本描述直接生成视频内容的人工智能技术。用户输入自然语言提示词，模型自动生成包含场景、角色、动作的动态视频。与 AI图生视频互补：文生视频从零开始创作，图生视频则在静态图片基础上添加动态效果。

Aliases

文生视频
Text to Video (T2V)
TXT2VID
AI Video Generation from Text

Core Techniques

文本编码：将自然语言提示词编码为语义向量
图像生成：基于文本语义生成视频首帧或关键帧
时序扩散：通过扩散模型逐步生成帧间连续画面
运动建模：根据文本描述生成合理的物理运动
视频解码：将生成的隐表示解码为最终视频帧序列

Key Capabilities

纯文本驱动，无需准备素材图片
支持复杂场景描述和角色交互
风格可控（写实、动漫、3D等）
生成时长通常2-6秒

Applications

概念演示视频
营销视频自动生成
创意内容快速原型

AI图生视频：在静态图片基础上添加动态效果，与本文生视频互补
运镜控制：摄像机运动参数对视频效果的影响