We use cookies to improve your experience with our site.

一种用于发现异质网络的多尺度结构的降维框架

A Dimensionality Reduction Framework for Detection of Multiscale Structure in Heterogeneous Networks

  • 摘要: 1.本文的创新点
    本文针对异质网络中多尺度社区结构的识别问题提出了一种降维框架,该框架把社区发现视为从网络拓扑的高维表示(每个节点对应一个维度)到低维表示(每个社区对应一个维度)的变换过程。该框架的主要创新点和本文的主要贡献体现在三个方面:1)该框架为拉普拉斯矩阵在经典图划分中所扮演的作用以及模块度矩阵在社区发现中所扮演的作用提供了一个统一的解释;2)该框架自然地把基于拉普拉斯矩阵或模块度矩阵的单一尺度社区发现方法扩展到多尺度社区发现;3)基于该框架,我们可以清晰地揭示出拉普拉斯矩阵和模块度矩阵在发现多尺度社区结构时不能很好地处理节点度异质分布带来的影响,进而通过引入尺度伸缩变换来解决该问题;4)在该框架下,尺度伸缩变化可以解释为一种线性核变换,因此,该框架为把非线性核方法(kernel method)引入到社区发现问题提供了一种通用的思路。
    2.实现方法
    我们把网络中每个节点视为一个维度,采用降维的方法来获取网络拓扑的一个简化表示,该简化表示下的每个维度对应一个社区。基于该思路,我们对拉普拉斯矩阵和模块度矩阵进行谱分析,使用显著的eigengap来分析网络的多尺度社区结构。进而,我们把尺度伸缩变换引入到拉普拉斯矩阵和模块度矩阵,有效解决了网络节点度的异质分布对多尺度社区发现带来的影响。
    3.结论及未来待解决的问题
    网络社区发现问题本质上可以视为网络降维,即提取出可以刻画网络结构规则性的显著维度。在本文提出的降维框架下,可以看出,对网络的拉普拉斯矩阵和模块度矩阵进行谱分析,不仅可以发现单一尺度的社区结构,而且可以自然地扩展到多尺度社区发现。另外,本文指出网络节点度的异质分布严重影响多尺度社区发现的性能,尺度伸缩变换可以有效解决该问题。在本文提出的框架下,非线性核变化可以用于发现多尺度社区结构,然而本文所采用仍为线性核变化。同时,本文的方法基于矩阵的谱分析,其算法复杂度取决于矩阵特征值和特征向量求解的复杂度,我们期望看到该问题的高效并行化算法。
    4.实用价值或应用前景
    在线社会信息网络的快速发展积累了大规模的网络化数据,包括社交关系数据、社会化媒体中的关注关系数据等等,这些网络化的数据中蕴含着丰富的多尺度社区结构,同时,分析网络的多尺度社区结构可以帮助我们更好地理解和有效地利用社会信息网络。经验的分析表明,在线社会信息网络具有异质的节点度分布,给多尺度社区结构分析带来了挑战。本文针对“异质网络的多尺度社区分析”这一具有广泛应用前景和实用价值的问题展开研究,给出了一种一般性的降维求解框架,具有重要的理论意义和实用价值。

     

    Abstract: Graph clustering has been widely applied in exploring regularities emerging in relational data. Recently, the rapid development of network theory correlates graph clustering with the detection of community structure, a common and important topological characteristic of networks. Most existing methods investigate the community structure at a single topological scale. However, as shown by empirical studies, the community structure of real world networks often exhibits multiple topological descriptions, corresponding to the clustering at different resolutions. Furthermore, the detection of multiscale community structure is heavily affected by the heterogeneous distribution of node degree. It is very challenging to detect multiscale community structure in heterogeneous networks. In this paper, we propose a novel, unified framework for detecting community structure from the perspective of dimensionality reduction. Based on the framework, we first prove that the well-known Laplacian matrix for network partition and the widely-used modularity matrix for community detection are two kinds of covariance matrices used in dimensionality reduction. We then propose a novel method to detect communities at multiple topological scales within our framework. We further show that existing algorithms fail to deal with heterogeneous node degrees. We develop a novel method to handle heterogeneity of networks by introducing a rescaling transformation into the covariance matrices in our framework. Extensive tests on real world and artificial networks demonstrate that the proposed correlation matrices significantly outperform Laplacian and modularity matrices in terms of their ability to identify multiscale community structure in heterogeneous networks.

     

/

返回文章
返回