摘要:
近年来,流媒体直播已广泛应用在人们的生活中,主要使用TCP作为传输层协议。QUIC协议为直播流媒体提供了新的选择。然而,如何利用QUIC来传输直播视频还没有被深入研究。本文首先探究了通过TCP、QUIC及其多路径扩展(MPTCP和MPQUIC)传输直播视频时可以达到的用户体验质量(QoE)。我们观察到,MPQUIC在带宽聚合和传输可靠性方面实现了最佳性能。然而,网络波动可能会产生异构路径、高的链路丢包率和带宽下降,从而导致明显的QoE恶化。因此,我们研究了直播中的多路径报文调度问题,并设计了QUIC上的多路径自适应数据包调度方案4D-MAP。在4D-MAP中,我们提出了一种基于LinUCB的在线学习算法,以及四种新型调度机制,即Dispatch、Duplicate、Discard和Decompensate,来解决上述问题。4D-MAP分别仿真网络和真实网络中与最先进的多径传输方案进行了比较。实验结果显示,4D-MAP在直播中的用户体验优于其他方案。
研究背景 随着直播应用的快速发展,人们都在追求更加流畅和清晰的直播观感。截至2021年,76.6%的受访者使用实时信息传输协议(RTMP)进行直播,RTMP通常以TCP作为底层传输协议。但是基于TCP的直播会产生高握手延迟,且TCP的内核实现特性使其难以面向新需求扩展协议功能。QUIC协议可以改善TCP的上述缺陷,可以支持小于一个往返时间(RTT)的握手延迟,并且QUIC在用户态实现,支持跨应用层和传输层,能够面向应用改进传输策略,为优化直播用户体验提供了新的机遇。另一方面,更高质量的直播内容会对网络带宽和可靠性提出更高要求,超高清晰度直播视频有可能超过现有5G网络可提供带宽。这一趋势促使学术界和工业界探索新的传输解决方案,多路径传输技术可以利用多宿主设备上的多种网络接口,如WiFi、LTE和5G来聚合带宽资源并提供路径冗余。受多路径TCP(MPTCP)9影响,QUIC也提出了多路径扩展MPQUIC10。目前,MPQUIC已经被用来通过聚合多条路径的带宽来提高视频传输的性能和可靠性11,但其在直播中的应用仍处于起步阶段。
目的 为了探究在直播中应用多路径传输技术以及QUIC协议的性能,我们首先在RTMP协议上分别实现了基于MPTCP和MPQUIC的直播框架。在此基础上,我们进行了预实验对比MPQUIC和MPTCP协议的性能并探索将其应用于直播时的存在的问题。通过实验,我们观察到:(1) 基于MPTCP的直播比MPQUIC有更高的首开延时;(2)由于网络的波动,多条路径可能会变得异构,这会导致接收方收到报文乱序,从而降低报文的接收效率进而降低了直播的QoE的质量;(3)高丢包率使直播的QoE明显恶化;(4) 带宽不足无法适应突发的视频比特率。然而,目前的多路径报文调度方案不能很好地应对上述挑战,亟需自适应的多路径报文调度策略实现自适应面向网络状况和视频特征的决策。
方法 我们基于MPQUIC开发了一种面向直播的多路径自适应报文调度方案4D-MAP。在4D-MAP中,我们提出了四种新的调度方案中做出多路径自适应报文调度,即Dispatch、Duplicate、Discard和Decompensate。这“4D”调度机制相互配合并自适应地根据当前网络状况进行调整。具体来说,Dispatch机制为缓解由路径异构性导致的报文乱序,预先将相应大小的数据分配到路径中,使所有数据尽可能保序到达。Duplicate、Discard和Decompensate机制分别为冗余、主动丢弃和部分可靠重传策略。为了适应网络状况和视频特征的动态变化,我们采用基于LinUCB的在线学习方法在上述四个策略中进行自适应的切换。
结果 在大规模实验中,我们评估了4D-MAP在仿真和真实世界网络中的直播性能。我们对四个提出的调度机制进行了单元测试和并对整个系统的自适应能力进行了评估。根据结果显示,4D-MAP可以有效降低重缓冲时间、直播延迟和首开时间,在真实网络的实验中,4D-MAP的重缓冲时间相较于MPTCP、MPQUIC和Peekabo降低了97.6%、74.1%和95.0%,且与多路径传输方案MPTCP、MPQUIC相比,视觉保真度上没有太大损失,可以有效提升用户观看直播的体验。
结论 我们提出的多路径自适应报文调度解决方案4D-MAP,采用了RTMP over MPQUIC架构,通过在线学习进行4D机制调度。在仿真和真实世界网络中的实验结果表明,4D-MAP能够适应动态和异构的网络条件,可以降低重缓冲时间、直播延迟和首开延迟,而不影响视觉保真度。此外,这项工作提出了一个新的架构,将传输分为不同的模块,即感知和决策。在未来,可以根据各种应用的特点来定制灵活的感知和多路径资源分配。这项工作具有广阔的应用前景,可以为高清赛事直播、远程救援等应用场景提供有力的网络保障。进一步,4D-MAP可以面向更多复杂的应用,如发掘虚拟现实(VR)和增强现实(AR)中的传输问题,进行多路径传输技术的优化。