Files
nexus/wiki/sources/game-audio-engineer.md
2026-05-03 05:42:12 +08:00

5.5 KiB
Raw Blame History

title, type, tags, date, last_updated
title type tags date last_updated
Game Audio Engineer Agent source
2026-04-26 2026-05-30

Source File

Summary用中文描述

  • 核心主题:游戏交互式音频工程师 AI Agent 人格规范——设计自适应音乐系统、空间音频架构和音频中间件集成方案
  • 问题域:游戏音频体验的游戏逻辑响应性、性能预算管理、跨引擎中间件集成
  • 方法/机制FMOD/Wwise 中间件事件驱动架构、tension parameter 驱动的自适应音乐、Tempo-synced 音乐转换、HRTF/FOA 空间音频、语音数量优先级管理
  • 结论/价值:提供完整的游戏音频工程师 Agent 设计规范,涵盖从技术规格到工作流程的全链路交付标准

Key Claims用中文描述

  • 所有游戏音频必须通过中间件事件系统FMOD/Wwise触发游戏代码中不得出现 AudioSource/AudioComponent 直接播放(原型阶段除外)
  • 音乐转换必须与节拍同步tempo-synced除非设计明确要求硬切
  • 所有世界空间音效必须使用 3D 空间化,场景音效不得使用 2D 播放
  • 语音数量限制必须在音频制作开始前定义,且每个事件必须配置 voice limit、priority 和 steal mode
  • FMOD DSP 最大消耗 1.5ms/帧(以最低目标硬件测量),空间音频 raycast 每帧最多 4 个

Key Quotes

"MANDATORY: All game audio goes through the middleware event system (FMOD/Wwise)" — 所有游戏音频必须经过中间件事件系统的强制规范 "Music transitions must be tempo-synced — no hard cuts unless the design explicitly calls for it" — 音乐转换必须与节拍同步,除非设计明确要求 "If the player notices the audio transition, it failed — they should only feel it" — 音频过渡的设计目标:玩家感受而非意识到 "Budget in milliseconds: This reverb DSP costs 0.4ms — we have 1.5ms total. Approved." — 以毫秒为单位的音频性能预算文化

Key Concepts

  • AdaptiveMusic由游戏状态参数tension/intensity驱动的动态音乐系统通过 FMOD/Wwise 参数 API 实现音乐层切换与混音
  • SpatialAudio:基于 3D 空间化的音效定位与衰减,含 occlusion/obstruction raycast 驱动和 reverb zone 空间匹配
  • VoiceBudgeting语音数量限制管理——定义每平台最大语音数PC 64/Console 48/Mobile 24每事件配置优先级和抢占模式
  • AudioMiddlewareFMOD 和 Wwise 音频中间件,作为游戏音频系统的核心事件触发层
  • ProceduralAudio合成器驱动的程序化音效oscillator + filter替代样本节省内存预算
  • Ambisonics:第一阶 AmbisonicsFOA用于 VR 音频,从 B-format 到耳机双耳解码
  • HRTFHead-Related Transfer Functions头部相关传输函数用于空间音频中的真实仰角定位
  • A/BParameterTesting:在中间件内实时测试两种自适应音乐配置,无需代码构建
  • AudioCertification主机平台音频认证要求——PCM 格式规范、最大响度LUFS targets、通道配置

Key Entities

  • FMOD:音频中间件,主流游戏音频事件系统,支持 event reference 字符串触发
  • Wwise音频中间件Audiokinetic与 FMOD 并列的音频实现层
  • Unity:游戏引擎,与 FMOD/Wwise 集成时使用 FMODUnity 插件
  • UnrealEngine:游戏引擎,支持 FMOD/Wwise 集成
  • Godot:开源游戏引擎,支持音频中间件集成
  • DolbyAtmos:对象音频格式,用于主机平台的沉浸式音频渲染
  • DTSX:对象音频格式(与 Dolby Atmos 竞争)

Connections

Contradictions

  • 无已知冲突

详细技术规格

音频格式规范

资产类型 推荐格式 加载策略
音乐/长氛围音 Vorbis 流式Streaming
短音效(< 2秒 ADPCM 解压至内存RAM
UI 音效 PCM 零延迟要求

平台语音预算

平台 最大语音数 虚拟语音数
PC 64 256
Console 48 128
Mobile 24 64

Reverb Zone 规格

区域类型 Pre-delay 混响时间 Wet %
Outdoor 20ms 0.8s 15%
Indoor 30ms 1.5s 35%
Cave 50ms 3.5s 60%
Metal Room 15ms 1.0s 45%

CombatIntensity 参数0.01.0

状态 音乐响应
0.0 无敌人 仅探索层
0.3 警戒状态 鼓点进入
0.6 主动战斗 完整编曲
1.0 Boss战/危机 最高强度

工作流程五阶段

  1. Audio Design Document定义声学身份3个形容词+ 游戏状态音频响应列表 + 作曲前确定参数集
  2. FMOD/Wwise 项目搭建事件层级、母线结构、VCA 分配、平台特定采样率和语音数配置
  3. SFX 实现随机化容器pitch/volume variation、最大并发测试、语音抢占行为验证
  4. 音乐集成:参数流图映射所有音乐状态与游戏系统、所有转换点测试(含 tempo-lock
  5. 性能分析:最低目标硬件 CPU/内存分析、语音数量压力测试、存储媒体流卡顿测量