文献综述(或调研报告):
文献[1]主要包括了对各种常用的统计量的介绍及其分布以及三大抽样分布:卡方分布、F分布、t分布,同时介绍了参数估计的几种方法:矩估计,最大似然估计,最小方差无偏估计,贝叶斯估计,区间估计。此外还介绍了假设检验的基本思想,以及几种常见的假设检验:单个正态总体均值的检验,两个正态总体均值差的检验,成对数据检验,正态总体方差检验,似然比检验以及正态性检验。
文献[2]中主要参考的内容是聚类分析的方法及原理,其中介绍了聚类分析的数学模型,以及描述了类与类之间距离的量,有类平均法,重心法,最长距离法,最短距离法。此外还介绍了几种聚类方法,如系统聚类、动态聚类等方法,聚类分析的计算复杂通常使用计算机计算,该文主要介绍使用SAS软件来进行聚类分析的方法。
文献[3]主要介绍了对于Excel的基础功能的使用,如数据的格式化中, 基本数据的格式设置,条件格式的设置,样式的定义和使用,自定义格式的设置。还包括了排序筛选与分类汇总。主要的内容是数据透视表的使用,首先创建数据透视表,其次编辑数据透视表,最后还可以生成数据透视图。
文献[4] 主要介绍了Thurstonian和Bradley-Terry模型,是对成对比较数据进行分析的最常见的应用模型。基于他们的原理,在不同的领域提出了许多对这两种模型的发展。本文提供了对这些扩展的更新概述,包括如何解释对象和主体特定的协变量以及如何处理顺序成对比较数据。其中特别强调了依赖比较的模型。虽然这些模型贴近现实,但是由于数值上的各种困难,它们的使用也比较复杂。因此我们专注于执行问题。本文尤其具体地研究了依赖成对比较数据的模型,并进行了仿真研究来比较最大概率法与其他有限信息估计方法的表现。
文献[5]详细介绍了假设检验的原理和结果,简单阐述了原假设和备择假设的设置原则,并应用单向等级方差分析和双向等级方差分析两种假设检验方法解决非参数检验问题,简化了计算过程。
文献[6]指标之间的高度相关性及其重要性差异导致了传统聚类分析方法往往无法获得良好的分类效果。该文在对传统聚类分析方法及其改进方法的局限性展开探讨的基础上,运用数学方法重构了分类定义中的距离概念,通过定义自适应赋权的主成分距离为分类统计量,提出一种新的改进的主成分聚类分析方法——加权主成分距离聚类分析法。理论研究表明,加权主成分距离聚类分析法系统集成了已有聚类分析方法的优点,有充分的理论基础保证其科学合理性。仿真实验结果显示,加权主成分聚类分析法能够有效解决已有聚类分析方法在特定情形下的失真问题,所得分类效果更为理想。
[1]茆诗松,程依明,濮晓龙,概率论与数理统计教程,第二版,北京,高等教育出版社 252-415
[2]陈平等,应用数理统计,北京,机械工业出版社,285-296
[3]邓芳,Excel高效办公——数据处理与分析,2012,北京,人民邮电出版社,14-53
