1. 研究目的与意义、国内外研究现状(文献综述)
研究意义:线性回归模型是统计学中较为常用的模型,其大多数的应用都基于正态性假设。
但在环境科学、医学、金融、物理实验等领域,数据并不服从正态分布,且样本数据复杂多变。
因此如何合理地对非正态数据进行回归分析,成为了研究的热点。
2. 研究的基本内容和问题
研究目标 本课题旨在研究两成分混合gamma回归模型,通过推导求解出期望,方差等基本性质;并运用gauss-newton迭代法和em算法研究模型中参数的极大似然估计,最后运用matlab等统计软件进行随机模拟分析,验证模拟结果。
研究内容 (1)通过学习相关知识,推导出两成分混合gamma回归模型的理论模型和基本性质;(2)运用gauss-newton迭代法探讨两成分混合gamma回归模型中参数的极大似然估计。
(3)运用em算法探讨两成分混合gamma回归模型中参数的极大似然估计。
3. 研究的方法与方案
研究方法:通过阅读和学习gauss-newton迭代法和em算法的相关知识,推导出两成分混合gamma回归模型中两种方法的score函数和观测信息阵,研究模型中参数的极大似然估计。
并通过matlab进行数值模拟,分析结果。
技术路线:(1)根据gamma分布及gamma回归模型相关知识,推导出两成分混合gamma回归模型的理论基础与基本性质;(2)运用gauss-newton迭代法和em算法研究两成分混合gamma回归模型中参数的极大似然估计;(3)应用matlab软件进行数值模拟。
4. 研究创新点
随着社会的发展及数据分析进一步精确的需要, 混合gamma分布和有关回归模型的研究,已逐渐受到人们重视。
但相对来说,国内对于混合gamma回归模型的研究相对较少, 仍有许多问题需要进一步的探讨和研究。
本课题的创新之处有:(1)本文基于gauss-newton迭代法、em算法研究两成分混合gamma回归模型的参数估计,并透过数据对比这两种方法对参数估计的效果。
5. 研究计划与进展
2014年12月:确定课题研究方向,并学习相关知识;2015年1月:推导两成分混合Gamma分布的基本性质,并求解极大似然估计的Gauss-Newton迭代法和EM算法的score函数和观测信息阵;2015年2、3月:运用Matlab数学软件,结合Monte Carlo随机模拟方法进行数据模拟,并根据Gauss-Newton迭代法和EM算法,进行两成分混合Gamma回归模型的参数估计;2015年4月:整理数据,分析程序运行结果。
2015年5月:阅读相关文献,完成论文的撰写。
