一种新的脸部表情识别分类器—模糊深隐马尔可夫模型
A New Classifier for Facial Expression Recognition: Fuzzy Buried Markov Model
-
摘要: 1.动机与创新
人脸表情识别方法可广泛应用于人机交互、情感分析、视频与图像理解、人脸动画合成、类人机器人等领域。隐马尔可夫模型作为系统事件序列的统计模型已被用于人脸表情的识别,许多研究结果已表明了其有效性。为了提高表情的识别率,目前不少研究者也提出了一些改进的隐马尔可夫模型,如多流隐马尔可夫模型、嵌入式隐马尔可夫模型、分层隐马尔可夫模型、深隐马尔可夫模型等。深隐马尔可夫模型由于特征向量的每一个元素还考虑到了其他特征向量的元素的直接依赖关系其识别性能更显优越。在图像序列中存在噪音和特征值缺损时,这些模型的识别性能并不令人满意。为了提高总体识别性能,特别是提高有噪音和特征值缺损情形的识别性能,本文在深隐马尔可夫模型的基础上提出了一种新型的模式分类器—模糊深隐马尔可夫模型,该模型加入观察元素间的特殊依赖关系,并利用云分布模型描述状态转移和观察符号生成,同时采用最大互信息准则优化模型参数。
2.实现方法
在深隐马尔可夫模型基础上,增加考虑了对观测值间的相关性、观测值及状态转移的模糊随机性和各待测模型间互信息的相关性等因素,设计了互信息算法来计算观测值之间的相关性;以云分布模型代替高斯分布模型估计观测值和状态转移概率,实现了观测值和状态转移模糊随机估算;同时引入最大互信息准则代替最大期望值估计准则实现模型参数优化,从而形成了模糊深隐马尔可夫模型。
利用算法分析、信息论、概率论等相关理论,对模糊深隐马尔可夫模型的特性进行了形式化的证明。认证了模糊深隐马尔可夫模型的复杂性与经典隐马尔可夫模型相当,对相同的训练数据而言,模糊深隐马尔可夫模型可得到更多的有用信息。分析表明了模糊深隐马尔可夫模型比隐马尔可夫模型和深隐马尔可夫模型具有更好的类别鉴别能力和对测试数据的鲁棒性。
采用Gabor小波变换对表情图像序列进行特征提取,将模糊深隐马尔可夫模型应用于图像序列的人脸表情识别,实验表明模糊深隐马尔可夫模型具有更高的识别率,同时能更好地容忍有噪音和特征值缺损的情形。
3.结论及未来待解决的问题
经理论分析和实验结果验证表明,本文所提出的模糊深隐马尔可夫模型较之于传统隐马尔可夫模型和深隐马尔可夫模型,具有更好的分类识别性能和容忍噪音及特征值缺损的能力。下一步的工作是,确定模型的最佳状态数目和引入半监督学习的方法更合理地训练该模型。
4.实用价值或应用前景
模糊深隐马尔可夫模型适合于有噪音和特征值缺损情形的图像序列的表情识别,此外模糊深隐马尔可夫模型以其具有高的识别率和鲁棒性的特点,也可适用于其他有噪音的特征数据分类识别情形。Abstract: To overcome the disadvantage of classical recognition model that cannot perform well enough when there are some noises or lost frames in expression image sequences, a novel model called fuzzy buried Markov model (FBMM) is presented in this paper. FBMM relaxes conditional independence assumptions for classical hidden Markov model (HMM) by adding the specific cross-observation dependencies between observation elements. Compared with buried Markov model (BMM), FBMM utilizes cloud distribution to replace probability distribution to describe state transition and observation symbol generation and adopts maximum mutual information (MMI) method to replace maximum likelihood (ML) method to estimate parameters. Theoretical justifications and experimental results verify higher recognition rate and stronger robustness of facial expression recognition for image sequences based on FBMM than those of HMM and BMM.