5.5 KiB
5.5 KiB
title, type, tags, date
| title | type | tags | date |
|---|---|---|---|
| Game Audio Engineer Agent | source | 2026-04-26 |
Source File
Summary(用中文描述)
- 核心主题:游戏交互式音频工程师 AI Agent 人格规范——设计自适应音乐系统、空间音频架构和音频中间件集成方案
- 问题域:游戏音频体验的游戏逻辑响应性、性能预算管理、跨引擎中间件集成
- 方法/机制:FMOD/Wwise 中间件事件驱动架构、tension parameter 驱动的自适应音乐、Tempo-synced 音乐转换、HRTF/FOA 空间音频、语音数量优先级管理
- 结论/价值:提供完整的游戏音频工程师 Agent 设计规范,涵盖从技术规格到工作流程的全链路交付标准
Key Claims(用中文描述)
- 所有游戏音频必须通过中间件事件系统(FMOD/Wwise)触发,游戏代码中不得出现 AudioSource/AudioComponent 直接播放(原型阶段除外)
- 音乐转换必须与节拍同步(tempo-synced),除非设计明确要求硬切
- 所有世界空间音效必须使用 3D 空间化,场景音效不得使用 2D 播放
- 语音数量限制必须在音频制作开始前定义,且每个事件必须配置 voice limit、priority 和 steal mode
- FMOD DSP 最大消耗 1.5ms/帧(以最低目标硬件测量),空间音频 raycast 每帧最多 4 个
Key Quotes
"MANDATORY: All game audio goes through the middleware event system (FMOD/Wwise)" — 所有游戏音频必须经过中间件事件系统的强制规范 "Music transitions must be tempo-synced — no hard cuts unless the design explicitly calls for it" — 音乐转换必须与节拍同步,除非设计明确要求 "If the player notices the audio transition, it failed — they should only feel it" — 音频过渡的设计目标:玩家感受而非意识到 "Budget in milliseconds: This reverb DSP costs 0.4ms — we have 1.5ms total. Approved." — 以毫秒为单位的音频性能预算文化
Key Concepts
- AdaptiveMusic:由游戏状态参数(tension/intensity)驱动的动态音乐系统,通过 FMOD/Wwise 参数 API 实现音乐层切换与混音
- SpatialAudio:基于 3D 空间化的音效定位与衰减,含 occlusion/obstruction raycast 驱动和 reverb zone 空间匹配
- VoiceBudgeting:语音数量限制管理——定义每平台最大语音数(PC 64/Console 48/Mobile 24),每事件配置优先级和抢占模式
- AudioMiddleware:FMOD 和 Wwise 音频中间件,作为游戏音频系统的核心事件触发层
- ProceduralAudio:合成器驱动的程序化音效(oscillator + filter)替代样本,节省内存预算
- Ambisonics:第一阶 Ambisonics(FOA)用于 VR 音频,从 B-format 到耳机双耳解码
- HRTF:Head-Related Transfer Functions,头部相关传输函数,用于空间音频中的真实仰角定位
- A/BParameterTesting:在中间件内实时测试两种自适应音乐配置,无需代码构建
- AudioCertification:主机平台音频认证要求——PCM 格式规范、最大响度(LUFS targets)、通道配置
Key Entities
- FMOD:音频中间件,主流游戏音频事件系统,支持 event reference 字符串触发
- Wwise:音频中间件(Audiokinetic),与 FMOD 并列的音频实现层
- Unity:游戏引擎,与 FMOD/Wwise 集成时使用 FMODUnity 插件
- UnrealEngine:游戏引擎,支持 FMOD/Wwise 集成
- Godot:开源游戏引擎,支持音频中间件集成
- DolbyAtmos:对象音频格式,用于主机平台的沉浸式音频渲染
- DTSX:对象音频格式(与 Dolby Atmos 竞争)
Connections
- game-development ← core_domain ← game-audio-engineer
- SpatialAudio ← depends_on ← AudioMiddleware(FMOD/Wwise 提供空间化 API)
- AdaptiveMusic ← extends ← SpatialAudio(音乐也需要空间化处理)
- ProceduralAudio ← extends ← AudioMiddleware(程序化替代样本)
Contradictions
- 无已知冲突
详细技术规格
音频格式规范
| 资产类型 | 推荐格式 | 加载策略 |
|---|---|---|
| 音乐/长氛围音 | Vorbis | 流式(Streaming) |
| 短音效(< 2秒) | ADPCM | 解压至内存(RAM) |
| UI 音效 | PCM | 零延迟要求 |
平台语音预算
| 平台 | 最大语音数 | 虚拟语音数 |
|---|---|---|
| PC | 64 | 256 |
| Console | 48 | 128 |
| Mobile | 24 | 64 |
Reverb Zone 规格
| 区域类型 | Pre-delay | 混响时间 | Wet % |
|---|---|---|---|
| Outdoor | 20ms | 0.8s | 15% |
| Indoor | 30ms | 1.5s | 35% |
| Cave | 50ms | 3.5s | 60% |
| Metal Room | 15ms | 1.0s | 45% |
CombatIntensity 参数(0.0–1.0)
| 值 | 状态 | 音乐响应 |
|---|---|---|
| 0.0 | 无敌人 | 仅探索层 |
| 0.3 | 警戒状态 | 鼓点进入 |
| 0.6 | 主动战斗 | 完整编曲 |
| 1.0 | Boss战/危机 | 最高强度 |
工作流程五阶段
- Audio Design Document:定义声学身份(3个形容词)+ 游戏状态音频响应列表 + 作曲前确定参数集
- FMOD/Wwise 项目搭建:事件层级、母线结构、VCA 分配、平台特定采样率和语音数配置
- SFX 实现:随机化容器(pitch/volume variation)、最大并发测试、语音抢占行为验证
- 音乐集成:参数流图映射所有音乐状态与游戏系统、所有转换点测试(含 tempo-lock)
- 性能分析:最低目标硬件 CPU/内存分析、语音数量压力测试、存储媒体流卡顿测量