13_适用于 Apple 设备的 HTTP 实时流式处理 (HLS) 创作规范(二)

音频

2. 音频编码要求

2.1. 音频数据应以基本音频流或 fMP4 形式提供。

2.2. 立体声音频格式为:

2.3. 必须提供 AAC、HE-AAC V1 或 HE-AAC v2 格式的立体声音频。

2.4. 如果我们的音频比特率高于 64 kbit/s,则不应使用 HE-AAC。

2.5. 支持的多声道音频格式包括:

2.6. 如果提供了杜比数字增强版,并且我们的流被传送到不支持杜比数字加号的设备,则还必须提供杜比数字。请参阅音频兼容性。

2.7. 立体声音频可能以多种比特率提供。

2.8. * 使用特定编解码器的多声道音频可能以多种比特率提供。

2.9. 总体比特率建议如下:

音频轨道 格式 总计(千比特/秒)
2.0 (stereo) AAC 32 to 160
2.0 (stereo) xHE-AAC 24 to 160
2.0 (stereo) Dolby Digital Plus 96 to 160
5.1 (surround) AAC 320
5.1 (surround) Dolby Digital 384
5.1 (surround) Dolby Digital Plus 192
7.1 (surround) Dolby Digital Plus 384
Nominally 16 Dolby Digital Plus with Dolby Atmos 384 to 768

2.10. * 我们可以在流中更改频道布局。

2.11. 频道布局更改必须与 EXT-X-DISCONTINUITY 标签结合使用。

2.12. 如果我们提供描述性视频服务(DVS),也称为“音频描述”,则必须使用属性FEATURES=“public.accessibility.describes-video”进行标记。

2.13. 如果我们提供 DVS,则自动选择属性的值必须为“是”。

2.14. DVS 音频的名称应表明该流是 DVS 内容。

2.15. 如果我们提供替代音频或 DVS,则必须在整个内容持续时间内提供它,即使它实际上只存在于部分主要内容中。

2.16. 当替代内容不可用时,替代音频或 DVS 可能会重复使用常规内容的音频片段。

2.17. 单个媒体段不得包含多个音频流。

2.18. 响度管理或动态范围控制应存在,除非所有内容(包括广告)都以相同的音频电平编码。

2.19. 在 fMP4 文件中,我们应该通过响度盒(“ludt”)提供响度信息。如果存在,响度框优先于音频流中的任何响度信息。

2.20. 在没有响度盒的情况下,杜比数字和杜比数字增强响度应由对白归一律字段指定 (ATSC A/52:2012)。

2.21. 对于 AAC,在没有响度框的情况下,AAC 对话响度应由 AAC prog_ref_level(ISO 14496-3 子条款 4.5.2.7)指定,如 SCTE 193-1 第 7.4.1 节指定,或由 ISO 23003-4 指定的响度Info() 有效载荷指定,在这种情况下,必须存在采样峰值电平或真峰值电平,测量系统必须为 2, 和方法定义必须是 1 或 2,而对于视频内容,它应该是 2。

2.22. 对于 xHE-AAC,必须根据 ISO 23003-4 表 I.5 中指定的基本响度元数据存在响度元数据;samplePeakLevel 或 truePeakLevel 必须存在。对于视频内容,方法定义应为 2。

2.23. 响度值必须表示内容的实际响度。

2.24. fMP4 文件中的 HE-AAC 必须使用 SBR 数据的显式信令。

2.25. xHE-AAC、Apple 无损和 FLAC 音频的容器格式必须是 fMP4。

2.26. 如果我们提供非杜比多声道音频,则还应提供多声道 AAC。

2.27. 对于音频描述,必须存在 LANGUAGE 属性,并指示用于传达描述的主要语言。

2.28. 为提高语音清晰度而准备或以其他方式处理的音频可以标记为属性 FEATURES=“public.accessibility.enhances-speech-intelligability”。

广告和前/中/后贴片

3.广告要求(另请参阅 Apple 设备的 HTTP 直播 (HLS) 创作规范的媒体播放列表部分。

3.1. 我们的广告和其他插入的媒体应包含在媒体播放列表中。

3.2. 插入的媒体应使用与媒体播放列表中其他内容相同的编解码器进行编码。

3.3. 插入的媒体应使用与媒体播放列表中其他内容相同的纵横比进行编码。

3.4. 插入的介质应等于或低于该变体的指定带宽。

辅助功能

4.无障碍要求

4.1. 我们的直播应提供字幕,以使失聪或听力障碍者可以访问内容。

4.2. 支持的字幕格式包括:

CEA-608 隐藏式字幕

CEA-708 隐藏式字幕

网络VTT字幕

IMSC1 字幕(仅限文本配置文件)

4.3. 隐藏式字幕(如果有)必须包含在视频媒体片段中。

4.4. 隐藏式字幕的存在必须通过包含语言属性的 EXT-X-MEDIA 标签声明。

4.5. 如果字幕轨道旨在为失聪或有听力障碍的人提供可访问性,则必须使用属性 FEATURES=“public.accessibility.transcribes-spoken-dialog,public.accessibility.describes-music-and-sound”标记。(具有此属性值的字幕与隐藏式字幕的处理方式相同。

4.6. 如果字幕轨道旨在为失聪或有听力障碍的人提供可访问性,则自动选择属性的值必须为“是”。

4.7. 语言属性必须包含在字幕轨道的 EXT-X-MEDIA 标签中。

4.8. 有关在直播中包含音频描述的信息,请参阅第 2.12 至 2.16 项。

字幕

5.字幕要求

5.1. 可能会提供字幕。

5.2. * 字幕必须是 WebVTT(根据 HLS 规范)或 IMSC1 在 fMP4 中。

5.3. WebVTT 字幕必须采用文本文件,并按照 HLS 规范使用 X-TIMESTAMP-MAP。

5.4. IMSC1 字幕必须采用 fMP4 文件。

5.5. 字幕播放列表必须存在于整个主要内容中,即使实际字幕仅存在于部分内容中。

5.6. 对于实时(线性)内容,字幕播放列表的目标时长必须与其他媒体相同。

5.7. 对于 VOD 内容,字幕播放列表的目标持续时间可能比其他媒体长。

5.8. 如果内容具有给定语言的强制字幕和常规字幕,则该语言的常规字幕轨道必须同时包含该语言的强制字幕和常规字幕。

5.9. 如果我们的视频包含刻录到视频中的文本,并且我们可以访问没有烧入的版本,则应改用强制字幕。(这使我们可以轻松地翻译成多种语言。使用强制字幕的一个例子是科幻电影,其中外星语言被翻译成英语。

5.10. 字幕的类型应在相关 EXT-X-STREAM-INF 标签的 CODECS 属性中指定。我们应该使用“stpp.ttml.im1t”来识别IMSC1字幕。我们可以使用“wvtt”来识别WebVTT字幕。

5.11. 强制字幕应始终具有AUTOSELECT=YES。