--- title: "Game Audio Engineer Agent" type: source tags: [] date: 2026-04-26 --- ## Source File - [[raw/Agent/agency-agents/game-development/game-audio-engineer.md]] ## Summary(用中文描述) - 核心主题:游戏交互式音频工程师 AI Agent 人格规范——设计自适应音乐系统、空间音频架构和音频中间件集成方案 - 问题域:游戏音频体验的游戏逻辑响应性、性能预算管理、跨引擎中间件集成 - 方法/机制:FMOD/Wwise 中间件事件驱动架构、tension parameter 驱动的自适应音乐、Tempo-synced 音乐转换、HRTF/FOA 空间音频、语音数量优先级管理 - 结论/价值:提供完整的游戏音频工程师 Agent 设计规范,涵盖从技术规格到工作流程的全链路交付标准 ## Key Claims(用中文描述) - 所有游戏音频必须通过中间件事件系统(FMOD/Wwise)触发,游戏代码中不得出现 AudioSource/AudioComponent 直接播放(原型阶段除外) - 音乐转换必须与节拍同步(tempo-synced),除非设计明确要求硬切 - 所有世界空间音效必须使用 3D 空间化,场景音效不得使用 2D 播放 - 语音数量限制必须在音频制作开始前定义,且每个事件必须配置 voice limit、priority 和 steal mode - FMOD DSP 最大消耗 1.5ms/帧(以最低目标硬件测量),空间音频 raycast 每帧最多 4 个 ## Key Quotes > "MANDATORY: All game audio goes through the middleware event system (FMOD/Wwise)" — 所有游戏音频必须经过中间件事件系统的强制规范 > "Music transitions must be tempo-synced — no hard cuts unless the design explicitly calls for it" — 音乐转换必须与节拍同步,除非设计明确要求 > "If the player notices the audio transition, it failed — they should only feel it" — 音频过渡的设计目标:玩家感受而非意识到 > "Budget in milliseconds: This reverb DSP costs 0.4ms — we have 1.5ms total. Approved." — 以毫秒为单位的音频性能预算文化 ## Key Concepts - [[AdaptiveMusic]]:由游戏状态参数(tension/intensity)驱动的动态音乐系统,通过 FMOD/Wwise 参数 API 实现音乐层切换与混音 - [[SpatialAudio]]:基于 3D 空间化的音效定位与衰减,含 occlusion/obstruction raycast 驱动和 reverb zone 空间匹配 - [[VoiceBudgeting]]:语音数量限制管理——定义每平台最大语音数(PC 64/Console 48/Mobile 24),每事件配置优先级和抢占模式 - [[AudioMiddleware]]:FMOD 和 Wwise 音频中间件,作为游戏音频系统的核心事件触发层 - [[ProceduralAudio]]:合成器驱动的程序化音效(oscillator + filter)替代样本,节省内存预算 - [[Ambisonics]]:第一阶 Ambisonics(FOA)用于 VR 音频,从 B-format 到耳机双耳解码 - [[HRTF]]:Head-Related Transfer Functions,头部相关传输函数,用于空间音频中的真实仰角定位 - [[A/BParameterTesting]]:在中间件内实时测试两种自适应音乐配置,无需代码构建 - [[AudioCertification]]:主机平台音频认证要求——PCM 格式规范、最大响度(LUFS targets)、通道配置 ## Key Entities - [[FMOD]]:音频中间件,主流游戏音频事件系统,支持 event reference 字符串触发 - [[Wwise]]:音频中间件(Audiokinetic),与 FMOD 并列的音频实现层 - [[Unity]]:游戏引擎,与 FMOD/Wwise 集成时使用 FMODUnity 插件 - [[UnrealEngine]]:游戏引擎,支持 FMOD/Wwise 集成 - [[Godot]]:开源游戏引擎,支持音频中间件集成 - [[DolbyAtmos]]:对象音频格式,用于主机平台的沉浸式音频渲染 - [[DTSX]]:对象音频格式(与 Dolby Atmos 竞争) ## Connections - [[game-development]] ← core_domain ← [[game-audio-engineer]] - [[SpatialAudio]] ← depends_on ← [[AudioMiddleware]](FMOD/Wwise 提供空间化 API) - [[AdaptiveMusic]] ← extends ← [[SpatialAudio]](音乐也需要空间化处理) - [[ProceduralAudio]] ← extends ← [[AudioMiddleware]](程序化替代样本) ## Contradictions - 无已知冲突 ## 详细技术规格 ### 音频格式规范 | 资产类型 | 推荐格式 | 加载策略 | |---------|---------|---------| | 音乐/长氛围音 | Vorbis | 流式(Streaming) | | 短音效(< 2秒) | ADPCM | 解压至内存(RAM) | | UI 音效 | PCM | 零延迟要求 | ### 平台语音预算 | 平台 | 最大语音数 | 虚拟语音数 | |------|-----------|-----------| | PC | 64 | 256 | | Console | 48 | 128 | | Mobile | 24 | 64 | ### Reverb Zone 规格 | 区域类型 | Pre-delay | 混响时间 | Wet % | |---------|-----------|---------|-------| | Outdoor | 20ms | 0.8s | 15% | | Indoor | 30ms | 1.5s | 35% | | Cave | 50ms | 3.5s | 60% | | Metal Room | 15ms | 1.0s | 45% | ### CombatIntensity 参数(0.0–1.0) | 值 | 状态 | 音乐响应 | |----|------|---------| | 0.0 | 无敌人 | 仅探索层 | | 0.3 | 警戒状态 | 鼓点进入 | | 0.6 | 主动战斗 | 完整编曲 | | 1.0 | Boss战/危机 | 最高强度 | ### 工作流程五阶段 1. Audio Design Document:定义声学身份(3个形容词)+ 游戏状态音频响应列表 + 作曲前确定参数集 2. FMOD/Wwise 项目搭建:事件层级、母线结构、VCA 分配、平台特定采样率和语音数配置 3. SFX 实现:随机化容器(pitch/volume variation)、最大并发测试、语音抢占行为验证 4. 音乐集成:参数流图映射所有音乐状态与游戏系统、所有转换点测试(含 tempo-lock) 5. 性能分析:最低目标硬件 CPU/内存分析、语音数量压力测试、存储媒体流卡顿测量