Files
nexus/wiki/concepts/AI文生视频.md
2026-04-23 04:02:48 +08:00

1.3 KiB
Raw Blame History

title, type, tags
title type tags
AI文生视频 concept
ai
video-generation
text-to-video

Definition

AI文生视频Text-to-Video是一种通过文本描述直接生成视频内容的人工智能技术。用户输入自然语言提示词模型自动生成包含场景、角色、动作的动态视频。与 AI图生视频 互补:文生视频从零开始创作,图生视频则在静态图片基础上添加动态效果。

Aliases

  • 文生视频
  • Text to Video (T2V)
  • TXT2VID
  • AI Video Generation from Text

Core Techniques

  • 文本编码:将自然语言提示词编码为语义向量
  • 图像生成:基于文本语义生成视频首帧或关键帧
  • 时序扩散:通过扩散模型逐步生成帧间连续画面
  • 运动建模:根据文本描述生成合理的物理运动
  • 视频解码:将生成的隐表示解码为最终视频帧序列

Key Capabilities

  • 纯文本驱动,无需准备素材图片
  • 支持复杂场景描述和角色交互
  • 风格可控写实、动漫、3D等
  • 生成时长通常2-6秒

Applications

  • 概念演示视频
  • 营销视频自动生成
  • 创意内容快速原型
  • AI图生视频:在静态图片基础上添加动态效果,与本文生视频互补
  • 运镜控制:摄像机运动参数对视频效果的影响