title, type, tags, sources, last_updated
| title |
type |
tags |
sources |
last_updated |
| Deepgram |
entity |
| asr |
| cloud-api |
| speaker-diarization |
| streaming |
|
| engineering-voice-ai-integration-engineer |
|
2026-05-02 |
Aliases
Definition
Deepgram 是一个云端自动语音识别(ASR)服务,以实时流式转录(Streaming API)和高准确度著称。支持说话人分离、PII 检测、关键词检测等多种高级功能,是 AssemblyAI 的主要竞品。
Key Capabilities
| 功能 |
说明 |
| 实时流式转录 |
WebSocket 流,支持低延迟实时字幕/笔记 |
| 批量转录 |
上传文件,异步返回结果 |
| 说话人分离 |
内置 Diarization,支持指定说话人数 |
| PII 检测 |
可选,开启后自动标记/脱敏 |
| 关键词检测 |
自定义关键词加权 |
| 语言模型 |
通用、医疗、法律等垂直领域模型 |
Competitive Positioning vs AssemblyAI
| 维度 |
Deepgram |
AssemblyAI |
| 实时流式 |
原生 WebSocket(更强) |
REST polling |
| 延迟 |
极低(<300ms) |
中等 |
| 准确度 |
领先(WER 基准) |
相当 |
| API 体验 |
更现代化 |
成熟稳定 |
| 语言覆盖 |
100+ 语言 |
100+ 语言 |
Use Cases
- 实时字幕:直播、会议、客服的实时字幕生成
- VoIP 集成:电话系统的实时转录
- 长音频批量:会议录音、播客批量处理
- 多语言:跨境会议的实时翻译字幕管道
Connections
Sources