Files
nexus/wiki/entities/Deepgram.md
2026-05-03 05:42:12 +08:00

51 lines
1.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "Deepgram"
type: entity
tags: ["asr", "cloud-api", "speaker-diarization", "streaming"]
sources: ["engineering-voice-ai-integration-engineer"]
last_updated: 2026-05-02
---
## Aliases
- Deepgram
## Definition
Deepgram 是一个云端自动语音识别ASR服务以实时流式转录Streaming API和高准确度著称。支持说话人分离、PII 检测、关键词检测等多种高级功能,是 AssemblyAI 的主要竞品。
## Key Capabilities
| 功能 | 说明 |
|------|------|
| 实时流式转录 | WebSocket 流,支持低延迟实时字幕/笔记 |
| 批量转录 | 上传文件,异步返回结果 |
| 说话人分离 | 内置 Diarization支持指定说话人数 |
| PII 检测 | 可选,开启后自动标记/脱敏 |
| 关键词检测 | 自定义关键词加权 |
| 语言模型 | 通用、医疗、法律等垂直领域模型 |
## Competitive Positioning vs AssemblyAI
| 维度 | Deepgram | AssemblyAI |
|------|---------|-----------|
| 实时流式 | 原生 WebSocket更强 | REST polling |
| 延迟 | 极低(<300ms | 中等 |
| 准确度 | 领先WER 基准) | 相当 |
| API 体验 | 更现代化 | 成熟稳定 |
| 语言覆盖 | 100+ 语言 | 100+ 语言 |
## Use Cases
- **实时字幕**:直播、会议、客服的实时字幕生成
- **VoIP 集成**:电话系统的实时转录
- **长音频批量**:会议录音、播客批量处理
- **多语言**:跨境会议的实时翻译字幕管道
## Connections
- [[FasterWhisper]] — 本地 ASR 替代方案
- [[AssemblyAI]] — 直接竞品,混合路由可两者都接入
- [[pyannote.audio]] — Deepgram 内置 Diarization 可替代独立 pyannote
## Sources
- [[engineering-voice-ai-integration-engineer]]