We use cookies to improve your experience with our site.

基于区块链的匿名跨域推荐模型

BAM_CRS: Blockchain-Based Anonymous Model for Cross-Domain Recommendation Systems

  • 摘要:
    研究背景 推荐系统作为有效的信息筛选工具,是现代电子商务平台必不可少的部分,高质量的推荐能够吸引更多的客户资源。但随着用户数量和产品数量的增加,推荐领域的数据稀疏与冷启动问题进一步加剧。跨域推荐作为解决以上问题的有效手段,主要通过融合辅助领域的知识来预测目标领域缺失的数据,以生成更为精确的用户模型,从而提高推荐质量。由于不同领域的数据之间往往存在某种关联,能够更为全面地提供用户偏好特征;但由于跨域推荐涉及的数据来源具有多源性、关联不确定性等复杂特征,导致其隐私泄露机理更为复杂;而跨域推荐环境的开放性使得数据安全性和完整性的安全威胁也更为复杂多变。因此,跨域推荐最大的挑战是如何同时保证数据的真实性和安全性,原因在于:一方面,隐私保护是必要的,如果没有有效的机制来保证数据的安全,没有人愿意提供数据用于推荐分析。然而现有的技术大多是通过身份隐藏或数据修改的方式来保护隐私安全,使得数据的真实性难以得到验证。另一方面,在缺少有效的数据验证机制情况下,一些参与者可能会出于自私或竞争的原因,选择提供虚假信息来获取其他参与者的信息。而用户数据的质量直接影响着推荐结果的准确性,虚假或恶意的数据会导致推荐的严重偏斜甚至产生负面影响。因此,数据安全性与可验证性问题需要同时解决,才能有效的提高跨域推荐的质量。
    目的 我们的研究目标是面向跨域推荐场景,设计一种能同时保证数据的安全性和可信性的匿名模型。
    方法 本文提出了一种基于区块链的匿名跨域推荐模型(BAM_CRS),采用多链结构来实现属性信息与关系信息的分离存储以保证隐私安全,同时利用数据上链的方式来实现数据的不可篡改与可追溯,结合一种基于签名的可验证机制来量化各平台的贡献,以激励真实数据的提交,降低恶意节点的攻击概率。最后在真实的跨域数据集上进行了实验性能分析和验证。
    结果 实验结果表明本文的匿名化模型在推荐精度方面与不考虑隐私的top-N推荐系统的性能接近,而优于已有的匿名技术;而在数据安全方面,本文方法能够满足k-匿名和差分隐私模型,结合基于贡献的激励机制可以有效的减少提交非真实性数据的概率,进而提高了数据的可信性。
    结论 从结果中可以看出,本文方法能够利用区块链的分离存储实现隐私安全、上链数据的不可篡改性实现源头的可追溯,进而实现跨域数据的安全无损融合,从而提高推荐质量,为跨域推荐框架提供了一种新的设计思路。

     

    Abstract: The cross-domain recommendation (CDR) technique has been widely applied in recommendation systems and can effectively relieve the data sparsity and cold start problems. However, it brings up data privacy and authenticity challenges due to different data sources. Most existing solutions only consider data privacy, and are not robust against participant poisoning attacks that affect the quality of recommendations. How to leverage the privacy and authenticity of data remains a key challenge. To this end, we propose a blockchain-based anonymous model for CDR systems (BAM_CRS). Under this model, we use a three-chain structure to store users, products, and the relationships between the two parties to guarantee privacy. This structure enables transactions to be separated from users and items to guarantee privacy and to establish consensus without relying on a central authority. For data authenticity, we warrant data imtamability and traceability through on-chain data collection and design a contribution-based quantification and incentive mechanism to ensure system sustainability. Additionally, a signature-based verifiable mechanism is designed to motivate node participation and further guarantee data authenticity. Experiments on real-life datasets demonstrate that our model can protect privacy with an advantage of about 2% improvement over baselines in terms of precision and F1 metrics.

     

/

返回文章
返回