通过包含用于响度和动态范围控制的元数据来确保音量标准化。
使用 xHE-AAC(扩展高效高级音频编解码器)编码的音轨包括用于响度和动态范围控制 (DRC) 的 MPEG-D DRC 元数据。使用 xHE-AAC 创建视频音轨时,请至少提供以下元数据,以确保不同服务的结果一致。要进行播放,请按照以下准则在解码器上设置 MPEG-D DRC 工具。
注意
有关这些元数据规范的其他信息,请参阅 ISO/IEC 23003-4。
视频内容中包含的响度和 DRC 元数据需要满足基本 DRC 元数据配置文件的 MPEG-D DRC 要求,并且始终包含以下值:
响度信息字段 | 价值 |
---|---|
包括方法定义 == “锚响度” 和测量系统 == “ITU-R BS.1770” 的方法值 | 使用语音门控测量锚点响度,或估计语音活动较低时 |
bs_true_peak_level或bs_sample_peak_level | 根据 ITU-R BS.1770 或样品峰电平的真实峰 |
使用 ITU-R BS.1770 标准测量对话词干的锚点响度,因为方法值必须反映内容的实际锚点响度。当只有完整混音可用于测量时,将语音门控应用于完整混音以获得锚响度值。
当语音检测器在完整混音中找不到太多语音时,锚点响度可能不准确。通过计算语音活动来监视此情况,语音活动是检测到的语音的持续时间除以内容的持续时间。当语音活动较低时,请忽略此测量值,因为它可能不准确。相反,从程序响度值和其他适用的度量中派生锚响度值,以从各种内容的统计信息中对值进行建模。有关其他信息,请参阅调整锚点响度。
drcSet所需 DRC 元数据的效果 | 支持具有最小峰值限制器参与 (LKFS) 的播放所需的最低电平 | 位在 drcInstructions 的 drcSetEffect 字段中的位置,其值必须为 1 |
---|---|---|
深夜 | -24 | 1 |
嘈杂的环境 | -16 | 2 |
播放范围有限 | -16 | 3 |
常规压缩 | -24 | 6 |
尽可能将 DRC 处理版本的输出锚点响度与未处理输出的锚点响度匹配。
用于常规压缩的 DRC 可以有多个实例来适应各种目标响度值,这提供足够的压缩以达到目标,而无需使用限幅器。如果特定响度目标不需要或不需要压缩,请包括没有压缩效果的常规压缩的相应 DRC。
注意
有关这些元数据规范的更多信息,请参阅 ISO/IEC 23003-4:2020 表 12。
配置 MPEG-D DRC 解码器,以便根据以下规范进行播放。配置完全或部分在系统级别进行,这些设置不会显示在 API 级别。
设置 MPEG-D DRC 解码器,为以下响度元数据分配最高优先级:****
元数据字段 | 值(最高优先级) |
---|---|
methodDefinition | Anchor Loudness |
measurementSystem | Expert/Panel |
如果未指定“锚定响度”,则 methodDefinition 字段默认为“程序响度”(如果存在)。此配置偏离 ISO/IEC 23003-4 中指定的默认配置,后者选择具有最高优先级的节目响度和 ITU-R BS.1770。但是,该标准指定了一个接口来自定义配置,包括响度元数据优先级。
某些以前部署的实现可能使用默认的 ISO/IEC 23003-4 配置,并且可能不支持用于自定义的接口。除了其他响度元数据外,这些系统还可以选择具有程序响度(如果存在)的方法定义值的响度元数据。这可能会导致除了节目响度之外,选择锚响度(如果存在)的系统偏离相同内容的输出响度。
注意
有关Expert/Panel值的测量系统的优先级顺序的信息,请参阅 ISO/IEC 23003-4:2020 表 51。
下表 (ANSI/CTA-2075) 提供了 DRC 工具的建议目标响度值设置,用于控制输出端的积分响度:
传感器声压级范围 | 最大声压级 (分贝) | 目标响度 (LKFS) |
---|---|---|
small | below 75 | -16 |
medium | between 70 and 90 | -24 |
large | above 85 | -31 |
unknown | NA | -24 |
要获得足够的输出声压级,请确保目标响度值取决于有源换能器的声压级范围,该范围分为三类(小、中、大)。通过使用-24 LKFS的粉红噪声测量传感器在预期听者位置的最大SPL,选择SPL范围类别。根据 ANSI/CTA-2075 附录 G 所述的中间列分配类别。例如,便携式设备中的微型扬声器通常属于小型SPL范围类别。
下表指定了针对不同聆听环境和换能器声压级范围的相应 DRC 请求 (ANSI/CTA-2075):
环境 | 传感器声压级范围 | DRC请求 |
---|---|---|
ideal, unknown | small | limited |
ideal, unknown | large, medium, unknown | general |
noisy | all | noisy |
注意
理想的环境是安静的聆听环境。
当我们需要响度归一化时,请求 DRC 的常规请求,除非不同的 DRC 请求适用于播放方案。这将应用适当的压缩以达到目标响度,例如在归一化期间应用增益时。
用户首选项可以覆盖 DRC 设置。下表提供了两个首选项的示例,以及应用这些首选项的条件、传感器 SPL 范围和环境:
用户首选项 | 环境 | 传感器声压级范围 | DRC请求 |
---|---|---|---|
max DRC | all | all | noisy |
late night | ideal, unknown | large, medium, unknown | late night |