34 lines
1.5 KiB
Markdown
34 lines
1.5 KiB
Markdown
---
|
||
title: "播客生成"
|
||
type: concept
|
||
tags: [ai, content-generation, tts, llm]
|
||
sources: [google-神级生产力工具-所有-github-开源平替都找到了, podcast-production-pipeline]
|
||
last_updated: 2026-04-23
|
||
---
|
||
|
||
## Definition
|
||
播客生成(Podcast Generation)是将文本内容(文档、网页、PDF 等多模态输入)通过 AI 技术转换为逼真的多人对话音频的流程。核心是 LLM 脚本生成 + TTS 语音合成的组合。
|
||
|
||
## Technical Pipeline
|
||
1. **内容输入**:PDF、网页、音频、YouTube 字幕等多模态格式
|
||
2. **文本理解**:LLM 提取核心信息和关键观点
|
||
3. **脚本生成**:LLM 生成双人/多人对话脚本,赋予角色性格
|
||
4. **语音合成(TTS)**:使用 ElevenLabs、Google TTS、Edge TTS 等引擎生成自然语音
|
||
5. **音频编辑**:合并多轨音频,添加过渡效果
|
||
|
||
## Key Parameters
|
||
- **角色数量**:NotebookLM 双人对话;OpenNotebook 支持最多 4 位演讲者
|
||
- **内容模式**:短视频风格(Shorts)vs 长篇深度(Longform)
|
||
- **语言支持**:多语言(Podcastfy 支持 100+ LLM 脚本生成)
|
||
- **TTS 引擎**:OpenAI、Google、ElevenLabs、Microsoft Edge TTS 等
|
||
|
||
## Applications
|
||
- 学习消化:通过听来消化复杂资料
|
||
- 内容创作:将长文转化为播客,扩大受众覆盖
|
||
- 知识分享:将文档内容以音频形式分发
|
||
|
||
## Related Concepts
|
||
- [[LLM]] — 脚本生成的大脑
|
||
- [[TTS]](文本转语音)— 语音合成引擎
|
||
- [[文档问答]] — NotebookLM 的另一个核心功能
|