摘要:
1、研究背景(context)
360°视频正在成为近年来的主要多媒体形式之一,与传统视频相比,它为观众提供了更多互动的沉浸式体验。当今的大多数实现都依赖于笨重的头戴式显示器 (HMD) 或需要触摸屏操作来进行交互式显示,这种方法不仅价格昂贵,而且对观看者来说也不方便。 并且还有一定比例的用户(大约 10-20%)在使用HMD时会出现恶心症状。据我们所知,目前还没有关于不使用HMD或者触屏操作在移动设备上进行360°视频播放的相关研究。
2、目的(Objective)
在本文中,我们展示了交互式 360°视频流的视场控制可以通过当今移动设备(例如智能手机)的前置摄像头检测到的视线运动来完成。为此,我们设计了一种轻量级的实时视线追踪方法。 并通过该结果进行360°视频流视场的更新。
3、方法(Method)
我们的解决方案仅使用前置摄像头,通过轻量级的类 Haar 级联分类器检测用户的面部信息,测量用户面对屏幕的距离和视角,然后按照自定义的三角模型推导出用户注视点的位置.我们将其与流媒体模块集成并应用动态边缘自适应算法,以最大限度地减少电池受限的移动设备的整体能耗。
4、结果(Result & Findings)
我们首先评估了轻量级视线追踪方法的性能。我们将整个屏幕划分为 9块,让观众尽量将注意力集中在每个块的中心3到5秒。实验结果表明大部分注视点都位于正确的区域内,但仍有一些点位于区域外。鉴于当今智能手机的快速发展,尤其是嵌入式神经计算芯片的出现,我们相信很快可以在智能手机上实现高精度。我们方法的延迟从大约 200 毫秒降低到 132 毫秒,这在大多数情况下是可以接受的。除此之外,我们评估了动态边缘自适应算法的性能及其对节能的贡献。为了评估我们算法的可行性,我们定义了两个新的评估矩阵,名为“像素精确率”(PPR)和“像素效率”(PER)。 为了评估我们的方法对能源效率的贡献,我们测量了并对比了我们的方法与其他方法的耗电量。实验结果表明我们的方法可以达到能源效率和显示质量的最佳平衡。
5、结论(Conclusions)
我们在本文中设计了一种新的实时视线追踪方法,并将其应用于交互式 360°视频流。 这种方法使用户免于头戴式显示器和操作的不便。 为了解决我们系统面临的能耗挑战,我们设计了一种动态边缘自适应算法来提高系统的能耗效率。 在智能手机上的实验证明了我们系统的可行性和效率。 虽然现在它的精度仍然很低,我们必须在电脑上模拟一些模块,但我们相信它为未来的应用程序和设备带来了新的方向。 在未来的工作中,我们将继续使用瞳孔中心估计算法提高视线追踪的准确性,并探索其他新的方法,如帧编码,以减少更多的能源消耗。 我们还将探索模型压缩等高级机器学习方法,并努力在智能手机上完整的实现整套系统。