We use cookies to improve your experience with our site.

基于影像遗传学数据的发现帕金森症的危险基因和异常脑区的有效WRF框架

An Efficient WRF Framework for Discovering Risk Genes and Abnormal Brain Regions in Parkinson's Disease Based on Imaging Genetics Data

  • 摘要: 1、研究背景
    作为脑科学的一个新兴研究领域,多模态数据融合分析在帕金森病等复杂脑疾病的研究中引起了广泛的关注。越来越多的研究者不局限于单一模态数据的探索,而是将焦点放在不同模态数据之间的融合上,致力于从多个层面来揭发疾病的致病机制。然而,目前的研究主要集中在不同模态数据之间的关联性检测和数据属性的约简上,忽略了数据融合后的整体挖掘框架和方法。
    2、目的
    我们的研究目标是通过开发一个集特征构建、特征选择和样本分类为一体的整体挖掘框架来实现对帕金森症的全面分析。
    3、方法
    我们提出一个加权随机森林模型作为特征筛选分类器。用相关分析方法检测基因与脑区的相互作用作为输入多模态融合特征。我们在加权随机森林的基础上实现了样本分类和最优特征选择,并构建了一个用于探索帕金森症致病因素的多模态分析框架。
    4、结果
    在Parkinson's Progression Markers Initiative数据库中的实验结果表明,加权随机森林比一些先进的方法表现出更好的性能,并且检测到了与帕金森症相关的脑区和基因。另外,我们还表明加权随机森林是一种非常有潜力的工具,可以对其他类似的脑部疾病进行多模态数据融合分析。
    5、结论
    本研究利用静息态fMRI数据和遗传数据进行多模态融合,并引入加权随机森林模型来准确区分帕金森患者和正常人,最后检测出帕金森症的病变脑区和危险基因。我们的工作可以改善帕金森患者的分类,更全面地检测出病因,为脑疾病的诊断和研究提供了一个有价值的新视角。在之后的工作中,有以下几个可以进一步研究的问题。首先,可以使用其他大脑模板来匹配图像,比如Broadman。其次,可能有比基因与功能磁共振成像这两组数据融合更好的组合。最后,我们通过大量已有的研究证实了大多数典型致病因素的合理性,证明了该方法的有效性。对于少数非典型致病因素,由于目前相关研究的缺乏,我们将在后续的研究工作中收集更多的数据,设计新的算法进行深入分析,更好地说明其在帕金森病发病机制中的作用。

     

    Abstract: As an emerging research field of brain science, multimodal data fusion analysis has attracted broader attention in the study of complex brain diseases such as Parkinson's disease (PD). However, current studies primarily lie with detecting the association among different modal data and reducing data attributes. The data mining method after fusion and the overall analysis framework are neglected. In this study, we propose a weighted random forest (WRF) model as the feature screening classifier. The interactions between genes and brain regions are detected as input multimodal fusion features by the correlation analysis method. We implement sample classification and optimal feature selection based on WRF, and construct a multimodal analysis framework for exploring the pathogenic factors of PD. The experimental results in Parkinson's Progression Markers Initiative (PPMI) database show that WRF performs better compared with some advanced methods, and the brain regions and genes related to PD are detected. The fusion of multi-modal data can improve the classification of PD patients and detect the pathogenic factors more comprehensively, which provides a novel perspective for the diagnosis and research of PD. We also show the great potential of WRF to perform the multimodal data fusion analysis of other brain diseases.

     

/

返回文章
返回