Files
nexus/wiki/entities/Deepgram.md
2026-05-03 05:42:12 +08:00

1.7 KiB
Raw Blame History

title, type, tags, sources, last_updated
title type tags sources last_updated
Deepgram entity
asr
cloud-api
speaker-diarization
streaming
engineering-voice-ai-integration-engineer
2026-05-02

Aliases

  • Deepgram

Definition

Deepgram 是一个云端自动语音识别ASR服务以实时流式转录Streaming API和高准确度著称。支持说话人分离、PII 检测、关键词检测等多种高级功能,是 AssemblyAI 的主要竞品。

Key Capabilities

功能 说明
实时流式转录 WebSocket 流,支持低延迟实时字幕/笔记
批量转录 上传文件,异步返回结果
说话人分离 内置 Diarization支持指定说话人数
PII 检测 可选,开启后自动标记/脱敏
关键词检测 自定义关键词加权
语言模型 通用、医疗、法律等垂直领域模型

Competitive Positioning vs AssemblyAI

维度 Deepgram AssemblyAI
实时流式 原生 WebSocket更强 REST polling
延迟 极低(<300ms 中等
准确度 领先WER 基准) 相当
API 体验 更现代化 成熟稳定
语言覆盖 100+ 语言 100+ 语言

Use Cases

  • 实时字幕:直播、会议、客服的实时字幕生成
  • VoIP 集成:电话系统的实时转录
  • 长音频批量:会议录音、播客批量处理
  • 多语言:跨境会议的实时翻译字幕管道

Connections

Sources