--- title: "Deepgram" type: entity tags: ["asr", "cloud-api", "speaker-diarization", "streaming"] sources: ["engineering-voice-ai-integration-engineer"] last_updated: 2026-05-02 --- ## Aliases - Deepgram ## Definition Deepgram 是一个云端自动语音识别(ASR)服务,以实时流式转录(Streaming API)和高准确度著称。支持说话人分离、PII 检测、关键词检测等多种高级功能,是 AssemblyAI 的主要竞品。 ## Key Capabilities | 功能 | 说明 | |------|------| | 实时流式转录 | WebSocket 流,支持低延迟实时字幕/笔记 | | 批量转录 | 上传文件,异步返回结果 | | 说话人分离 | 内置 Diarization,支持指定说话人数 | | PII 检测 | 可选,开启后自动标记/脱敏 | | 关键词检测 | 自定义关键词加权 | | 语言模型 | 通用、医疗、法律等垂直领域模型 | ## Competitive Positioning vs AssemblyAI | 维度 | Deepgram | AssemblyAI | |------|---------|-----------| | 实时流式 | 原生 WebSocket(更强) | REST polling | | 延迟 | 极低(<300ms) | 中等 | | 准确度 | 领先(WER 基准) | 相当 | | API 体验 | 更现代化 | 成熟稳定 | | 语言覆盖 | 100+ 语言 | 100+ 语言 | ## Use Cases - **实时字幕**:直播、会议、客服的实时字幕生成 - **VoIP 集成**:电话系统的实时转录 - **长音频批量**:会议录音、播客批量处理 - **多语言**:跨境会议的实时翻译字幕管道 ## Connections - [[FasterWhisper]] — 本地 ASR 替代方案 - [[AssemblyAI]] — 直接竞品,混合路由可两者都接入 - [[pyannote.audio]] — Deepgram 内置 Diarization 可替代独立 pyannote ## Sources - [[engineering-voice-ai-integration-engineer]]