Auto-sync: 2026-04-23 04:02

This commit is contained in:
2026-04-23 04:02:48 +08:00
parent d1e7e4344b
commit 6f44ff76a2
64 changed files with 3300 additions and 1129 deletions

View File

@@ -0,0 +1,33 @@
---
title: "播客生成"
type: concept
tags: [ai, content-generation, tts, llm]
sources: [google-神级生产力工具-所有-github-开源平替都找到了, podcast-production-pipeline]
last_updated: 2026-04-23
---
## Definition
播客生成Podcast Generation是将文本内容文档、网页、PDF 等多模态输入)通过 AI 技术转换为逼真的多人对话音频的流程。核心是 LLM 脚本生成 + TTS 语音合成的组合。
## Technical Pipeline
1. **内容输入**PDF、网页、音频、YouTube 字幕等多模态格式
2. **文本理解**LLM 提取核心信息和关键观点
3. **脚本生成**LLM 生成双人/多人对话脚本,赋予角色性格
4. **语音合成TTS**:使用 ElevenLabs、Google TTS、Edge TTS 等引擎生成自然语音
5. **音频编辑**:合并多轨音频,添加过渡效果
## Key Parameters
- **角色数量**NotebookLM 双人对话OpenNotebook 支持最多 4 位演讲者
- **内容模式**短视频风格Shortsvs 长篇深度Longform
- **语言支持**多语言Podcastfy 支持 100+ LLM 脚本生成)
- **TTS 引擎**OpenAI、Google、ElevenLabs、Microsoft Edge TTS 等
## Applications
- 学习消化:通过听来消化复杂资料
- 内容创作:将长文转化为播客,扩大受众覆盖
- 知识分享:将文档内容以音频形式分发
## Related Concepts
- [[LLM]] — 脚本生成的大脑
- [[TTS]](文本转语音)— 语音合成引擎
- [[文档问答]] — NotebookLM 的另一个核心功能