We use cookies to improve your experience with our site.

不确定移动对象的不确定距离范围查询

Uncertain Distance-Based Range Queries over Uncertain Moving Objects

  • 摘要: 1.本文的创新点
     
     
  • 提出了不确定环境下的距离范围查询定义。区分了不确定目标与不确定的查询范围之间六种拓扑关系,并据此推导出在不确定性呈均匀分布的情况下,高效的概率计算方法。此方法无论在精度上还是时间代价上都大大优于现有研究中采用的蒙特卡罗(Monte-Carlo)方法。此外,通过大量实验说明本文的方法也可以近似表示不确定性呈高斯分布的情况,误差在可接受范围内。
  • 提出了空间剪枝策略和概率剪枝策略有效降低了搜索空间,避免不必要的计算,提高了查询的效率。
  • 引入了误报率和漏报率来度量查询结果的质量,分析了不确定性大小,距离阈值以及概率阈值对查询结果质量的影响。

    2.实现方法
      采用 TPR-tree 作为不确定移动对象的索引,在数据项中引入了不确定项用于表示对象不确定区域的半径。设计了空间剪枝和概率剪枝两类策略来降低搜索空间,具体实现了基于范围和基于距离的三种方法,尽可能排除不可能满足查询的结点和对象。对于剪枝得到的候选对象,首先分析其与不确定查询范围之间的拓扑关系,再计算对象满足查询的概率,最后将概率超过阈值的对象作为结果返回。

    3.结论及未来待解决的问题
      针对目标对象和查询发出者本身位置均不确定的情况,设计并实现了移动对象环境下不确定距离范围的查询算法,通过实验验证了方法的有效性和效率。
      对于在欧氏空间以及道路网约束环境下,不确定移动对象的连续不确定距离范围查询,反最近邻查询,相互最近邻查询等,都是值得研究的问题。此外,对于其他不确定性分布的情况(如高斯分布),如何进行高精度、高效地概率计算也是值得探讨的问题。

    4.实用价值或应用前景
      移动对象的运动具有连续性,由于受网络带宽和容量的限制,数据库中不可能实时记录对象在每一时刻的位置。在绝大多数的应用中,一般采用最近一次更新作为数据库位置,因此查询发出时,对象的实际位置往往与数据库位置或期望位置不同,而且是不可准确获知的。如果直接采用数据库位置进行计算,那么返回的结果必然是不准确的。不确定区域包含了移动对象在某一时刻所有可能的位置,采用不确定区域进行查询计算可以避免以上问题。本文针对的距离范围查询,如“找出当前到A 距离不超过5km 所有车辆”,是一类常见的查询类型,并且也是最近邻查询等其他查询类型的基础。结果中包含了对象满足查询的概率值,有利于用户进行选择。并且允许用户根据需要自己设定阈值,使得只有概率高于阈值的对象被返回。阈值越低漏报率越低,当阈值为0 时漏报率为0,阈值越高误报率越低,阈值为1 时误报率为0。本文的思想在基于位置的服务(LBS),和位置隐私保护中的查询也是适用的。
     
     
     
     
     
     
  •  

Abstract: Distance-based range search is crucial in many real applications. In particular, given a database and a query issuer, a distance-based range search retrieves all the objects in the database whose distances from the query issuer are less than or equal to a given threshold. Often, due to the accuracy of positioning devices, updating protocols or characteristics of applications (for example, location privacy protection), data obtained from real world are imprecise or uncertain. Therefore, existing approaches over exact databases cannot be directly applied to the uncertain scenario. In this paper, we redefine the distance-based range query in the context of uncertain databases, namely the probabilistic uncertain distance-based range (PUDR) queries, which obtain objects with confidence guarantees. We categorize the topological relationships between uncertain objects and uncertain search ranges into six cases and present the probability evaluation in each case. It is verified by experiments that our approach outperform Monte-Carlo method utilized in most existing work in precision and time cost for uniform uncertainty distribution. This approach approximates the probabilities of objects following other practical uncertainty distribution, such as Gaussian distribution with acceptable errors. Since the retrieval of a PUDR query requires accessing all the objects in the databases, which is quite costly, we propose spatial pruning and probabilistic pruning techniques to reduce the search space. Two metrics, false positive rate and false negative rate are introduced to measure the qualities of query results. An extensive empirical study has been conducted to demonstrate the efficiency and effectiveness of our proposed algorithms under various experimental settings.

 

  • /

    返回文章
    返回