隐马尔可夫模型的两种估计方法的比较开题报告

 2021-08-08 02:08

全文总字数:4885字

1. 研究目的与意义

随着计算机科学技术及其相关相关学科的高速发展,信息和人们的生活休戚相关,对人们的出行和生活有着深刻的影响。数据信息作为一种资源,它的普遍性、共享性、增值性、可处理性和多效用性,使其对于人类具有特别重要的意义。如何从复杂多变的数据中提取有价值的信息、发掘随机现象背后深层次、本质的规律已经成为当今社会一个主要任务。如今提取信息数据的一个重要途径是借助于经典的统计模型进行数据挖掘。

然而在实际应用中,多元数据不仅呈现出指标之间的关联性,而且还呈现出时序方面的变异性,同时,观测数据还呈现出多峰、偏态、异常点等异质性,这对于基于经典的、基于独立性和正态性假设的因子分析模型的统计分析构成挑战。可是激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更加深层次的数据分析,但是目前的数据库系统只能够实现数据的录入、查询、和统计等功能,本文的目的是开发一种新的模型,混合隐马尔可夫模型,其统一为多个进程现有的隐马尔可夫模型以及在这方面的工作提供了一个总体框架。这些模型允许协变量和在这两个条件和模型的隐蔽部位随机效应的掺入扩展的类的隐马尔可夫模型。MHMMs的优点很多。首先,同时模拟多个进程允许的人口水平影响的是所有流程的参数估计,以及更有效的估计。第二,这些模型比较容易理解。最后,MHMMS许可在建模相关结构具有更大的灵活性,因为它们放松假定观测是独立提供的隐藏状态。

隐马尔科夫模型作为一种统计分析模型,该模型最早被应用在语音识别领域,80年代后得到了广泛的传播和发展,新的应用领域不断涌现出来,隐马尔科夫模型已经成为应用最广泛、最成功的统计模型之一。作为信号处理的一个重要方向,HMM广泛应用于图像处理,模式识别,和生物信号处理,等领域的研究中,并取得了诸多成果。近年来,很多的研究者把HMM应用于计算机视觉,神经网络,人脸识别和经济预算等新兴领域中。因此,进一步研究各种新型的马尔科夫模型及其性质,进行数据的统计分析具有着非常重要的意义。

2. 国内外研究现状分析

隐马尔科夫模型是由隐马尔科夫过程和观测过程组成:前者形成一阶离散马尔可夫过程,用来描述各个潜在状态之间的概率转移;而后者描述状态与观察序列间的关系。MacDonald and Zucchini的专著对该模型的数学性质、统计建模和应用作了一个较为全面的综述。

隐马尔可夫模型有许多应用领域,包括语音识别(例如,Levinson, Rabiner ,Sondhi 1983),基因分析和识别(例如,Krogh 1998),胎羊运动的建模(Leroux , Puterman 1992). Albert,McFarland, Smith, Frank (1994)利用隐马尔可夫因子模型病灶计数观察多发性硬化(MS)患者的应用程序将在2和6部分进一步讨论。这些模型中的一个共同特点是,它们已经被开发用于单个流程。多进程的少数隐马尔可夫模型已经被认为是文学。大部分是在特定应用背景下开发的,因此没有构成完整的普遍性。人们很少知道围绕这些模型的理论。

3. 研究的基本内容与计划

要求:

1)前言部分:要弄清楚隐马尔因子分析模型丶极大似然估计和贝叶斯估计。指出两种估计的差异。分析该模型时会遇到了什么困难,如何解决,给出国内外最新进展情况, 以及得到的结论;

2)方案拟定、数据分析,结果分析和结论;

3)叙述清楚,理论严密,数据准确可靠,结果合理。

计划:

1)第1到2周:熟悉数据的背景;查阅指定的参考文献;了解该模型的特点。初步了解题目意思,基本理解大体框架;

2)第3-4周:资料收集,制定论文撰写计划,对照资料完成开题报告和任务书;

3)第5周到第10周:解决理论和计算问题,撰写论文;

4)第11周到第12周:修改打印论文;

5)作好准备答辩。

4. 研究创新点

1)对隐马尔科夫模型理论的发展、基本理论以及建模的建立和实现都进行了详细的阐述;

2)在贝叶斯统计分析中,全部未知的均处理为随机变量,它们的不确定性用概率分布来量化,为减少计算量,利用正态尺度规模混合来构建Gibbs抽样;

3)使用Chib方法来近似Bayes因子。同时使用拉普拉斯表示为正态分布的尺度规模混合,再利用数据扩充,从而进行Bayes分位数回归以及统计分析;

4)采用流行的MCMC方法,利用Gibbs抽样器和MH算法从后验分布抽取随机样本。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。