Files
nexus/wiki/concepts/播客生成.md
2026-04-23 04:02:48 +08:00

34 lines
1.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "播客生成"
type: concept
tags: [ai, content-generation, tts, llm]
sources: [google-神级生产力工具-所有-github-开源平替都找到了, podcast-production-pipeline]
last_updated: 2026-04-23
---
## Definition
播客生成Podcast Generation是将文本内容文档、网页、PDF 等多模态输入)通过 AI 技术转换为逼真的多人对话音频的流程。核心是 LLM 脚本生成 + TTS 语音合成的组合。
## Technical Pipeline
1. **内容输入**PDF、网页、音频、YouTube 字幕等多模态格式
2. **文本理解**LLM 提取核心信息和关键观点
3. **脚本生成**LLM 生成双人/多人对话脚本,赋予角色性格
4. **语音合成TTS**:使用 ElevenLabs、Google TTS、Edge TTS 等引擎生成自然语音
5. **音频编辑**:合并多轨音频,添加过渡效果
## Key Parameters
- **角色数量**NotebookLM 双人对话OpenNotebook 支持最多 4 位演讲者
- **内容模式**短视频风格Shortsvs 长篇深度Longform
- **语言支持**多语言Podcastfy 支持 100+ LLM 脚本生成)
- **TTS 引擎**OpenAI、Google、ElevenLabs、Microsoft Edge TTS 等
## Applications
- 学习消化:通过听来消化复杂资料
- 内容创作:将长文转化为播客,扩大受众覆盖
- 知识分享:将文档内容以音频形式分发
## Related Concepts
- [[LLM]] — 脚本生成的大脑
- [[TTS]](文本转语音)— 语音合成引擎
- [[文档问答]] — NotebookLM 的另一个核心功能