流媒体带宽压力大,视频云的脱困之法

周凯扬
由于4K以上的超高清视频原始数据过大,对网络传输带宽和存储都会造成巨大的压力,所以我们需要更高效的视频编解码技术,诸如H.265、AV1等。但为了更高效地实现理想的压缩率,我们必须要依仗编解码的软硬件优化,这也是各大云服务平台加大相关投入的一大原因。

本文来自微信公众号“电子发烧友网”,文/周凯扬。

由于4K以上的超高清视频原始数据过大,对网络传输带宽和存储都会造成巨大的压力,所以我们需要更高效的视频编解码技术,诸如H.265、AV1等。但为了更高效地实现理想的压缩率,我们必须要依仗编解码的软硬件优化,这也是各大云服务平台加大相关投入的一大原因。

亚马逊Graviton

亚马逊作为全球最大的云服务厂商,过去在面对视频编解码的负载时主要使用英特尔的至强系列处理器,利用其AVX指令等矢量处理功能来加速视频处理。而亚马逊在推出自研CPU Graviton系列之后,就开始探索用Arm处理器和软件来完成高清视频的编码任务。

360截图16251112669372.png

Graviton 3 CPU/亚马逊

自2021年以来,开源H.265编码器libx265获得了相当多的优化,尤其是对Arm的Neon指令做了优化.像亚马逊Graviton 2这样基于Arm Neoverse架构的平台,都可以通过其支持的Neon指令来加速编码效率。

根据亚马逊给出的数据,与基于x86 CPU的C6i实例相比,基于Graviton 3的C7g实例在H.264编码性能上提升了63%,在H.265编码性能上提升了60%,与此同时还将成本降低了20%左右。Graviton CPU在高并发下的性能也允许将4K视频同时编码成不同分辨率,以满足不同设备的观看需求。

平头哥倚天710

面对阿里云在音视频领域日益剧增的需求,平头哥选择了用软硬结合+自研编码内核的方式来解决。2021年,平头哥发布了倚天710这颗基于ARMv9架构5nm工艺的CPU,核心数多达128颗,主频最高3.2GHz。

360截图16251112669372.png

倚天710 CPU/平头哥

阿里云也基于这一CPU打造了倚天ECS,借其算力和功耗优势来赋能视频云转码业务,并对阿里自研的HEVC、AVC编码器s265、s264编码器进行了深度的优化。比如在高并发的视频编解码任务下,倚天710也不会大幅降频,从而维持高性能运转。

而相比之下,基于x86架构的CPU在高并发的情况下,就会为了控制功耗而选择降频,从而影响了单核的编解码性能。目前阿里云也已经将ECS部署在视频云点播上,大幅提升编码性能的同时,还些许提高了压缩率,实现了成本与效率双赢,满足视频云生态的高清化普及。

更复杂的H.266

最后我们再来看看2020年推出的VVC编码,也就是H.266编码。H.266相较于H.265,压缩效率提高了50%,但编码的复杂程度也提升了近十倍。腾讯在H.266第一版标准确定后不久,就已经推出了经过优化的266解码器,并针对Arm平台做了优化,可靠单核解码1080p,多核实现4K串流。

2021年7月,腾讯云宣布商用H.266编解码标准,其转码和媒体处理应用将支持H.266,播放器和其他产品将支持H.266解码,帮助用户节省空间和带宽的同时保证视频质量,这也使其成了首个支持H.266标准的云服务厂商。

但无论是云端还是终端,支持H.266硬件编解码的芯片并不多,已知的有联发科的Pentonic 2000/1000/700电视芯片以及瑞昱的RTD1319D机顶盒芯片,至于软件编解码的方案在效率上肯定是难以与硬件方案比肩的。

问题在于目前H.266尚没有获得大规模普及,就像当年的H.265一样。H.265推出不久,硬件加速解码并没有完全普及,且因为授权限制不少公司没法提供软件支持,但如今H.265带来的体积和画质优势。

小结

从主流流媒体平台来看,AV1、HEVC、AVC三者仍会是短期内的首选,但如果视频内容生态逐渐转向8K、120FPS这样的超高规格,效率更高的H.266将成为最理想的编码,也会催生出一批新的编解码硬件。

至于视频直播应用,最适合的还是Xilinx Alveo加速卡或英伟达GPU这样的方案,因为这种场景追求的还是低延迟传输高质量图像。CPU的软件编解码方案虽然灵活性更高,但在实时传输上还是稍逊一筹,作为视频流媒体网站离线编解码的高性价方案倒是很合适。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论