We use cookies to improve your experience with our site.

基于普适环境的数据集成中数据不一致性解决方案研究

A Solution of Data Inconsistencies in Data Integration --- Designed for Pervasive Computing Environment

  • 摘要: 1. 本文的创新点
    本文的主要贡献如下:
    1)在普适环境中为了获得准确的数据源质量信息以及处理定性的数据源质量指标值,我们采用了模糊多属性群决策方法。
    2)本文也定义了一个新的数据源质量指标――“历史可信度”。这个指标用于表示在数据不一致性问题处理过程中数据源提供的数据的整体“正确”程度。历史可信度基于用户反馈进行修改。这样,数据质量好的数据源会得到更高的历史可信度,从而可以提高解决数据不一致性问题的准确度。
    3)为了提高用户满意度和数据不一致性解决方案的正确程度,我们把数据源质量分为两方面包括数据质量和花费质量进行考虑。
    4)本文设计并实现了一组实验来验证本文提出的策略和算法。基于与对比算法的比较,证明本文的算法和策略能够有效解决数据不一致性问题。

    2.实现方法
    在普适环境中,数据集成有了一些新的特点。例如,如果设备移动了,它们的位置发生了改变,从而可能动态的影响数据和数据源的可用性。这表明,数据源质量可能经常发生改变并且获得实际的数据源质量指标数据是非常困难的。通过把不同方法获得的数据源质量指标数据进行整合,可以获得更加准确的数据源质量数据。以上过程的本质是多属性群决策问题。
    对于普适环境中数据集时成产生的数据不一致性问题,本文针对普适环境特点,给出了数据不一致性问题的解决方案。在本文中我们使用数据源的数据质量指标和花费质量指标来解决数据集成中的数据不一致性。在定义了这两种指标后,我们给出了数据集成模型。基于我们给出的模型,我们可以方便的定义,查找和解决数据不一致性问题。我们提出的解决数据不一致性问题的方法分为两个阶段。第一个阶段基于数据源的花费质量指标,并且使用功用函数来对数据源进行初步筛选。第二个阶段基于普适环境的特点,我们使用了基于数据源的数据质量指标的模糊多属性群决策方法来选择最合适的数据源提供的数据作为数据不一致性的解决结果。最后,我们还设计了一组实验检验我们提供的方法的有效性。

    3.结论及未来待解决的问题
    在普适环境中,我们提出了数据集成中数据不一致性的解决方案,并设计了一组实验验证了其有效性。通过对实验结果进行分析,可以看出我们的解决方案可以获得较高的准确度和用户满意度,并且,所选提供解决结果的数据源质量都较高。在将来,还有进一步的研究工作需要做。例如,为了获得更好的数据不一致性解决结果,可以基于用户满意度设计并建立历史可信度的模型。

    4.实用价值或应用前景
    本文中的研究工作对未来普适环境中进一步完善相关问题的解决提供了借鉴,并且这将有助于新解决方案的研究和设计。

     

    Abstract: New challenges including how to share information on heterogeneous devices appear in data-intensive pervasive computing environments. Data integration is a practical approach to these applications. Dealing with inconsistencies is one of the important problems in data integration. In this paper we motivate the problem of data inconsistency solution for data integration in pervasive environments. We define data quality criteria and expense quality criteria for data sources to solve data inconsistency. In our solution, firstly, data sources needing high expense to obtain data from them are discarded by using expense quality criteria and utility function. Since it is difficult to obtain the actual quality of data sources in pervasive computing environment, we introduce fuzzy multi-attribute group decision making approach to selecting the appropriate data sources. The experimental results show that our solution has ideal effectiveness.

     

/

返回文章
返回