22_为 xHE-AAC 视频音轨提供元数据

通过包含用于响度和动态范围控制的元数据来确保音量标准化。

概述

使用 xHE-AAC(扩展高效高级音频编解码器)编码的音轨包括用于响度和动态范围控制 (DRC) 的 MPEG-D DRC 元数据。使用 xHE-AAC 创建视频音轨时,请至少提供以下元数据,以确保不同服务的结果一致。要进行播放,请按照以下准则在解码器上设置 MPEG-D DRC 工具。

注意

有关这些元数据规范的其他信息,请参阅 ISO/IEC 23003-4。

配置用于内容生成的元数据

视频内容中包含的响度和 DRC 元数据需要满足基本 DRC 元数据配置文件的 MPEG-D DRC 要求,并且始终包含以下值:

响度元数据

响度信息字段 价值
包括方法定义 == “锚响度” 和测量系统 == “ITU-R BS.1770” 的方法值 使用语音门控测量锚点响度,或估计语音活动较低时
bs_true_peak_level或bs_sample_peak_level 根据 ITU-R BS.1770 或样品峰电平的真实峰

使用 ITU-R BS.1770 标准测量对话词干的锚点响度,因为方法值必须反映内容的实际锚点响度。当只有完整混音可用于测量时,将语音门控应用于完整混音以获得锚响度值。

当语音检测器在完整混音中找不到太多语音时,锚点响度可能不准确。通过计算语音活动来监视此情况,语音活动是检测到的语音的持续时间除以内容的持续时间。当语音活动较低时,请忽略此测量值,因为它可能不准确。相反,从程序响度值和其他适用的度量中派生锚响度值,以从各种内容的统计信息中对值进行建模。有关其他信息,请参阅调整锚点响度。

DRC元数据

drcSet所需 DRC 元数据的效果 支持具有最小峰值限制器参与 (LKFS) 的播放所需的最低电平 位在 drcInstructions 的 drcSetEffect 字段中的位置,其值必须为 1
深夜 -24 1
嘈杂的环境 -16 2
播放范围有限 -16 3
常规压缩 -24 6

尽可能将 DRC 处理版本的输出锚点响度与未处理输出的锚点响度匹配。

用于常规压缩的 DRC 可以有多个实例来适应各种目标响度值,这提供足够的压缩以达到目标,而无需使用限幅器。如果特定响度目标不需要或不需要压缩,请包括没有压缩效果的常规压缩的相应 DRC。

注意

有关这些元数据规范的更多信息,请参阅 ISO/IEC 23003-4:2020 表 12。

配置用于播放的元数据

配置 MPEG-D DRC 解码器,以便根据以下规范进行播放。配置完全或部分在系统级别进行,这些设置不会显示在 API 级别。

响度元数据

设置 MPEG-D DRC 解码器,为以下响度元数据分配最高优先级:****

元数据字段 值(最高优先级)
methodDefinition Anchor Loudness
measurementSystem Expert/Panel

如果未指定“锚定响度”,则 methodDefinition 字段默认为“程序响度”(如果存在)。此配置偏离 ISO/IEC 23003-4 中指定的默认配置,后者选择具有最高优先级的节目响度和 ITU-R BS.1770。但是,该标准指定了一个接口来自定义配置,包括响度元数据优先级。

某些以前部署的实现可能使用默认的 ISO/IEC 23003-4 配置,并且可能不支持用于自定义的接口。除了其他响度元数据外,这些系统还可以选择具有程序响度(如果存在)的方法定义值的响度元数据。这可能会导致除了节目响度之外,选择锚响度(如果存在)的系统偏离相同内容的输出响度。

注意

有关Expert/Panel值的测量系统的优先级顺序的信息,请参阅 ISO/IEC 23003-4:2020 表 51。

下表 (ANSI/CTA-2075) 提供了 DRC 工具的建议目标响度值设置,用于控制输出端的积分响度:

传感器声压级范围 最大声压级 (分贝) 目标响度 (LKFS)
small below 75 -16
medium between 70 and 90 -24
large above 85 -31
unknown NA -24

要获得足够的输出声压级,请确保目标响度值取决于有源换能器的声压级范围,该范围分为三类(小、中、大)。通过使用-24 LKFS的粉红噪声测量传感器在预期听者位置的最大SPL,选择SPL范围类别。根据 ANSI/CTA-2075 附录 G 所述的中间列分配类别。例如,便携式设备中的微型扬声器通常属于小型SPL范围类别。

DRC元数据

下表指定了针对不同聆听环境和换能器声压级范围的相应 DRC 请求 (ANSI/CTA-2075):

环境 传感器声压级范围 DRC请求
ideal, unknown small limited
ideal, unknown large, medium, unknown general
noisy all noisy

注意

理想的环境是安静的聆听环境。

当我们需要响度归一化时,请求 DRC 的常规请求,除非不同的 DRC 请求适用于播放方案。这将应用适当的压缩以达到目标响度,例如在归一化期间应用增益时。

用户首选项可以覆盖 DRC 设置。下表提供了两个首选项的示例,以及应用这些首选项的条件、传感器 SPL 范围和环境:

用户首选项 环境 传感器声压级范围 DRC请求
max DRC all all noisy
late night ideal, unknown large, medium, unknown late night