高维稀疏分位数回归中的变量选择方法及应用开题报告

 2021-08-08 00:51:49

全文总字数:2168字

1. 研究目的与意义

本文主要对高维数据分位数回归做研究,查阅文献,发现目前关于分位数回归的研究主要集中在金融领域,因为在金融领域中很多的模型都是尖峰或者厚尾的情况,相较于最小二乘法,分位数回归能够很好的处理这些数据并能够得到不同分位点时的回归方程。

因此,在本篇文章中,研究分位数回归与最小二乘法在处理异方差或者尖峰厚尾的数据所具备的优势的时候,选取国内股票市场的数据进行对比。为了选择符合我们要求的,需要的股票作为研究对象,需要剔除掉存在缺失或者偏差的数据;然后借鉴国外成熟的理论,结合本国股票市场,总结出26个影响因素,接着通过聚类分析的筛选出13个具有代表性的影响因素;最后通过找到的数据,运用最小二乘法和分位数回归的方法分析这些影响因素对股票收益率的实际影响情况,对比最小二乘法和分位数回归方法的优劣,通过在分位数回归方法下的分析结果,能够一定程度上指导投资者投资和上市公司做出合理规划。

通过本文,当在面对异方差或者是尖峰厚尾数据时,可以得出分位数回归比最小二乘法更具有优势。同时分析分位数回归处理数据的特点,探究运用降维理论与分位数回归结合应用的例子,比较不同分位数点的参数变化,从而对模型进行解释和预测,指导人们的日常生活。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 国内外研究现状分析

分位数回归的起源很早,但是真正被人熟知是在1978年统计学家Koenker和经济学家Bassett提出的分位数理论,两人又在四年后,提出了分位数回归的线性检验和稳定性检验,从而分位数回归就如火如荼的发展起来。分位数回归在国外的研究比较完善,主要集中在经济、社会、生态、环境科学、公共卫生等多个方面。比如在金融领域,2009年Allen、Gerrans和Singh选择澳大利亚股票为样本,因为是尖峰厚尾的数据,因此在研究的过程中采用最小二乘法不能够很好解释头部和尾部的数据,但是运用分位数回归却能够很好的解释。在理论研究方面,1987年Koenker对于分位数回归的算法进行了研究,中间有段停滞期,直到2000年Muller和Kim对于分位数回归的的渐进的特性进行了研究,2002年Koenker又将分位数回归模型运用到异方差性的模型上,同年,吴建南和Bretschnrider在对随机数据研究的过程中,比较分位数回归与显著加权分析法的优劣,随后分位数回归日趋完善,随着大数据的发展,2013年Kulasekera应用到分位数回归分析高维数据。

而在国内,对于分位数回归的研究相对较少,起步相较于国外较晚。运用国外的理论,曾昭玲研究了权益融资和负债融资在不同分位数点影响差异,吴建南和马伟研究了分位数回归和显著加权法在参数估计上的异同,2006年谭治国和蔡乙萍对股票风险运用分位数回归进行了估计,2008年欧阳资生对上海上证指数和深圳成份指数运用分位数估计了VaR。同年,封福育对沪深两市A股市场的数据进行分位数的研究。2014年裴耀将回归分析和分位数回归进行了研究,比较两者的优劣。查阅相关文献,可以看出在国内主要研究分位数回归的应用,在理论研究方面比较薄弱。但随着国内外分位数回归理论的不断完善,以及大数据的出现,分位数回归在国内的应用也将越来越广。

3. 研究的基本内容与计划

本文的研究内容如下:

第一章,绪论。包括研究目的及意义、国内外研究的情况、本文的研究内容、本文的特色与创新。

第二章,聚类分析下的分位数回归和最小二乘法比较。包括聚类分析、分位数回归方法、最小二乘法的概念介绍

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

(1)本文在处理高维数据的时候,结合了降维中的聚类分析的理论。国内很多学者主要采用主成分分析的方法,来降低数据的维数,通过聚类的分析,可以选择出部分代表性的影响因素,并且这些影响因素都能够更多的反映其他因素的特征,更能透彻的分析影响因素与股票收益率之间的关系。

(2)本文加入了数值仿真的步骤,产生的数据具有异方差性、尖峰厚尾的特性,在一定程度说具有说服力。

(3)本文在选择数据时,选择具有尖峰厚尾性质的金融数据的股票数据,并且将分位数回归和最小二乘法进行了比较。这些数据在用最小二乘法处理时,只会给出一般的规律,而用分位数回归处理时,可以考虑头部和尾部的极端情况,这也能够说明分位数回归与最小二乘法在处理这类数据的优越性。在实证的过程中,给出了不同分位点的回归结果,而且还对尖峰厚尾的情况进行合理的解释。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。