37 lines
1.4 KiB
Markdown
37 lines
1.4 KiB
Markdown
---
|
||
title: "AI文生视频"
|
||
type: concept
|
||
tags: [ai, video-generation, text-to-video]
|
||
---
|
||
|
||
## Definition
|
||
AI文生视频(Text-to-Video)是一种通过文本描述直接生成视频内容的人工智能技术。用户输入自然语言提示词,模型自动生成包含场景、角色、动作的动态视频。与 [[AI图生视频]] 互补:文生视频从零开始创作,图生视频则在静态图片基础上添加动态效果。
|
||
|
||
## Aliases
|
||
- 文生视频
|
||
- Text to Video (T2V)
|
||
- TXT2VID
|
||
- AI Video Generation from Text
|
||
|
||
## Core Techniques
|
||
- **文本编码**:将自然语言提示词编码为语义向量
|
||
- **图像生成**:基于文本语义生成视频首帧或关键帧
|
||
- **时序扩散**:通过扩散模型逐步生成帧间连续画面
|
||
- **运动建模**:根据文本描述生成合理的物理运动
|
||
- **视频解码**:将生成的隐表示解码为最终视频帧序列
|
||
|
||
## Key Capabilities
|
||
- 纯文本驱动,无需准备素材图片
|
||
- 支持复杂场景描述和角色交互
|
||
- 风格可控(写实、动漫、3D等)
|
||
- 生成时长通常2-6秒
|
||
|
||
## Applications
|
||
- 概念演示视频
|
||
- 营销视频自动生成
|
||
- 创意内容快速原型
|
||
|
||
## Related Concepts
|
||
- [[AI图生视频]]:在静态图片基础上添加动态效果,与本文生视频互补
|
||
- [[运镜控制]]:摄像机运动参数对视频效果的影响
|