室内不确定语义轨迹相似性连接
Indoor Uncertain Semantic Trajectory Similarity Join
-
摘要:研究背景 多个研究结果表明,对于在不同国家和不同大洲的人们,大约87%的时间都花在了室内空间里,比如商场,机场和办公大楼里。相当多个体的移动限制在这样的室内空间里。除此之外,过去的几年见证了室内定位技术的巨大进步,以及室内定位系统的广泛分布。由上述关键因素的驱动,前所未有规模的室内轨迹正在被生成。这样的室内轨迹可以用于多种多样的室内应用,并且这些室内应用有望即将在接下来几年内迎来爆发。目的 通过考虑在这样的室内轨迹数据中的内在的不确定性和包含的予以信息,我们首次定义了一个新的定义,叫做室内不确定语言轨迹。除此之外,我们也提出了一个新的方法关于如何从给定的室内轨迹和复杂的室内拓扑关系合理推断和生成对应的室内不确定语义轨迹。我们关注一个新的基础的,不过相当重要的查询,叫做室内不确定语义轨迹相似性连接(Indoor Uncertain Semantic Trajectory similarity Join),简称为IUST-Join。IUST-Join查询就是从两个集合中去匹配上所有相似的室内不确定语义轨迹对。IUST-Join查询可以应用在大量重要的室内应用场景内,比如基于相似的购物兴趣进行朋友推荐,关键词相关的室内路径推荐,室内轨迹重复检测,地理文本数据清理等。方法 为了更加高效地处理IUST-Join查询,在室内不确定语义轨迹上的倒排索引3IST和第一个加速策略一起被提出来形成了一个过滤再验证的框架。通过使用这个框架,绝大多数室内不确定语义轨迹对可以以相当小的计算代价被过滤掉了。基于这个过滤再验证的框架,我们提出了一个高效的USP算法来处理IUST-Join查询。除此之外,我们也提出了许多新颖且高效的加速策略,这些加速策略都被嵌入USP算法中。由于这些技术的存在,USP算法处理IUST-Join查询的时间复杂度和时间开销都被进一步减小了。结果 我们做了大量的对比实验。实验结果证实了我们提出的方法明显具有更好的表现。通过实验证实了我们提出的USP算法与精心设计的基线算法比,大约98.5\%的执行时间能够被轻易地节省下来。结论 我们设计的USP算法在处理IUST-Join查询时,通过使用一个精心设计的过滤再验证的框架以及大量的新颖且有效的加速策略,大大减小了IUST-Join查询处理的时间复杂性和时间开销。Abstract: With the widespread deployment of indoor positioning systems, an unprecedented scale of indoor trajectories is being produced. By considering the inherent uncertainties and the text information contained in such an indoor trajectory, a new definition named Indoor Uncertain Semantic Trajectory is defined in this paper. In this paper, we focus on a new primitive, yet quite essential query named Indoor Uncertain Semantic Trajectory Similarity Join (IUST-Join for short), which is to match all similar pairs of indoor uncertain semantic trajectories from two sets. IUST-Join targets a number of essential indoor applications. With these applications in mind, we provide a purposeful definition of an indoor uncertain semantic trajectory similarity metric named IUS. To process IUST-Join more efficiently, both an inverted index on indoor uncertain semantic trajectories named 3IST and the first acceleration strategy are proposed to form a filtering-and-verification framework, where most invalid pairs of indoor uncertain semantic trajectories are pruned at quite low computation cost. And based on this filtering-and-verification framework, we present a highly-efficient algorithm named Indoor Uncertain Semantic Trajectory Similarity Join Processing (USP for short). In addition, lots of novel and effective acceleration strategies are proposed and embedded in the USP algorithm. Thanks to these techniques, both the time complexity and the time overhead of the USP algorithm are further reduced. The results of extensive experiments demonstrate the superior performance of the proposed work.