--- title: "播客生成" type: concept tags: [ai, content-generation, tts, llm] sources: [google-神级生产力工具-所有-github-开源平替都找到了, podcast-production-pipeline] last_updated: 2026-04-23 --- ## Definition 播客生成(Podcast Generation)是将文本内容(文档、网页、PDF 等多模态输入)通过 AI 技术转换为逼真的多人对话音频的流程。核心是 LLM 脚本生成 + TTS 语音合成的组合。 ## Technical Pipeline 1. **内容输入**:PDF、网页、音频、YouTube 字幕等多模态格式 2. **文本理解**:LLM 提取核心信息和关键观点 3. **脚本生成**:LLM 生成双人/多人对话脚本,赋予角色性格 4. **语音合成(TTS)**:使用 ElevenLabs、Google TTS、Edge TTS 等引擎生成自然语音 5. **音频编辑**:合并多轨音频,添加过渡效果 ## Key Parameters - **角色数量**:NotebookLM 双人对话;OpenNotebook 支持最多 4 位演讲者 - **内容模式**:短视频风格(Shorts)vs 长篇深度(Longform) - **语言支持**:多语言(Podcastfy 支持 100+ LLM 脚本生成) - **TTS 引擎**:OpenAI、Google、ElevenLabs、Microsoft Edge TTS 等 ## Applications - 学习消化:通过听来消化复杂资料 - 内容创作:将长文转化为播客,扩大受众覆盖 - 知识分享:将文档内容以音频形式分发 ## Related Concepts - [[LLM]] — 脚本生成的大脑 - [[TTS]](文本转语音)— 语音合成引擎 - [[文档问答]] — NotebookLM 的另一个核心功能