基于原型序列间信息的医疗时间序列缺失填充方法
Imputation with Inter-Series Information from Prototypes for Healthcare Time Series
-
摘要:研究背景 在医疗健康领域,时间序列数据中普遍存在缺失值问题,这为数据分析带来了显著挑战。现有的缺失值填充方法主要依赖于序列内部的信息,而忽视了序列间信息可能带来的潜在优势,例如降低不确定性以及减少记忆效应的影响。因此,如何有效利用序列间信息来提升填充效果,成为当前研究中的一个重要问题。目的 为了解决上述问题,本文提出了一种新型的缺失值填充模型PRIME(Prototype Recurrent Imputation Model,基于原型的循环填充模型),旨在通过结合序列内和序列间的信息,对不规则采样的时间序列中的缺失值进行更准确的填充,从而提升模型的整体性能。方法 PRIME模型的核心框架包括三个主要模块:(1)原型记忆模块,用于学习序列间的信息;(2)双向门控循环单元,利用原型信息进行缺失值填充;(3)注意力原型精炼模块,用于进一步调整填充结果。通过这种多层次的信息整合,PRIME能够更全面地捕捉时间序列中的潜在规律,从而提高填充的准确性。结果 为了验证PRIME的有效性,我们在四个公开数据集上进行了广泛的实验。实验结果表明,PRIME在均方误差(MSE)指标上相较于现有的最先进模型,最高实现了26%的相对性能提升,显著优于其他对比方法。同时,我们也在两个其他领域数据集上验证了PRIME的有效性。结论 本文提出的PRIME模型通过有效整合序列内和序列间的信息,成功解决了不规则采样时间序列中缺失值填充的难题。实验证明,PRIME在多个数据集上均表现出色,为医疗健康领域中的时间序列分析提供了一种可靠的工具。Abstract: Time series with missing values are ubiquitous in healthcare scenarios, presenting significant challenges for analysis. Despite existing methods addressing imputation, they predominantly focus on leveraging intra-series information, neglecting the potential benefits that inter-series information could provide, such as reducing uncertainty and memorization effect. To bridge this gap, we propose PRIME, Prototype Recurrent Imputation ModEl, which integrates both intra-series and inter-series information for imputing missing values in irregularly sampled time series. PRIME comprises a prototype memory module for learning inter-series information, a bidirectional gated recurrent unit utilizing prototype information for imputation, and an attentive prototypical refinement module for adjusting imputations. We conduct extensive experiments on four datasets, and the results underscore PRIME’s superiority over the state-of-the-art models by up to 26% relative improvement in mean square error. Our code is available at https://jcst.ict.ac.cn/news/382.
下载: