基于面板数据聚类的改善型灰色关联分析方法外文翻译资料

 2022-11-19 14:54:37

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


基于面板数据聚类的改善型灰色关联分析方法

摘要:本文提出了一种基于灰色关联分析(AGRA)的累积序列增强型灰色聚类分析方法,用于指定面板数据中聚类的层次结构。聚类方法可以处理包含个样本的面板数据,其中每个样本具有个时间序列的指标,对于给定时间序列的观测值可以在不同的时间测量其与其他序列的测量值,并且与其他序列相比包含不同数目的数据点。整体聚类方法称为Mean-AGRA聚类方法,它包含三个主要部分:每个单独时间序列的一系列变换;针对三种特定类型的灰色关联度,对所有样本的每对样本以及之后的适当组合的AGRA模型的灰色关联度进行适当的成对比较;并根据它们的AGRA度对所有样本进行聚类。为了说明这种新的聚类方法如何在实践中得到利用,将其应用于中国大陆30个省()的12个自然环境指标和8个社会时间序列()的面板数据。这些发现可以应用于像中国的各省可以如何根据地形对高原和平原两大类进行有意义的分类。这种新方法可以处理样本内和样本间不同长度的时间序列,当比较任何两个序列时,在不同时间出现值时,该方法非常有用。而且,新的聚类方法避免了传统方法中存在的两个相似度相似的样本相结合的问题。因此,AGRA模型和Mean-AGRA聚类方法扩大了灰色关联分析和聚类分析的应用范围。

关键词:聚类;面板数据;灰色关联分析;中国面板数据;

1.简介

灰色关联聚类分析根据关联度对对象进行聚类,并将同一类别下的聚类对象进行聚类。在处理二维数据时,现有的灰关联分析(gray relational analysis,GRA)模型构成了灰关联分析的基础。根据实际情况可以选择不同种类的GRA模型。 GRA已经在各个领域得到应用,而且它不仅仅限于数据分布和数量,还包括GRA有效结合聚类,决策,评估,优化方法, 预测法,模糊理论,预测方法,案例适应和极限学习机。另外,GRA模型已被广泛应用于社会经济学和工程实践问题的研究,如确定区域经济发展差距,确定影响服务品牌资产的因素,影响公司财务绩效的因素识别,软件评估,评估中国经济发展与能源消耗的关系,考察利用率可持续发展,确定了岩体的代表性基本体积,建立了最大洪量黄河上游高峰期,二维物体识别和失效模式和效应分析。

1.1相关研究

面板数据的灰色关联聚类分析需要处理两个问题。其中一个问题就是为面板数据开发一个GRA模型,并进行一些研究。 Zhang和Liu讨论了三维空间几何特征的相似性,为面板数据的灰色关联聚类分析提供了新的思路。Wu和Liu用Hessian矩阵定义了凸度,根据凸度对样本之间的相似度进行了表征,并基于凸度的灰关联分析提出了面板数据的灰关联聚类分析。Qian,Wang和Dang提供了一个灰色矩阵关系分析模型来确定样本的聚类。Liu,Dang,Qian,Zhou根据面板数据的几何特征提出了灰色网格关系模型。Li,Dang和Wan对面板数据进行了灰色关联模型分析。

第二个问题是设计一个基于灰关联度的聚类方法。现有的面板数据灰色关联聚类分析方法,采用Liu,dang,fang提出的聚类技术称为临界值聚类方法。与灰色关联聚类分析类似,其他传统聚类分析的扩展大部分都是针对面板数据提出新的距离或相似性度量。一些聚类方法首先需要在计算聚类之前降维或者转换面板数据。

1.2研究动机

为了使这些方法更加全面,需要研究灰关联分析和灰关联聚类分析。一些问题和相关的改进如下:(1)如果样本的顺序发生变化,某些灰关联度计算结果可能会发生变化。这是因为这些方法只考虑相邻样本之间的比较。为了克服这个问题,在计算中必须考虑所有样本的两两比较。(2)面板数据的现有关系模型,评价模型和决策模型都局限于在同一时间和同一时间段内具有等间隔观测值的时间序列数据。如果时间序列中的观测数量不同,一些研究人员仅将这些观测值用于对应于最短序列的时间序列。当一个时间序列存在差距时,一些研究者通过使用两个相邻观测的平均值或其他类型的插值技术来估计缺失值。因此,所有观测数据中的时间序列中可能存在的任何趋势都可能没有得到适当的考虑。(3)现有的关系模型不能保留某些数学特征,如给定时间序列的原始观测值中的“指标属性”和“内部属性”。(4)刘等人提出的临界值聚类方法可以作为一种快速的聚类方法。但是,有时可能会得到错误的结果。(5)根据距离对样本进行聚类时,在某些情况下可能会出现不正确的聚类。因此,在这个研究中趋势的相似性被用于聚类的目的。

liu等人指出灰色关联理论和实践成果主要集中在以实数序列描述研究对象及其行为特征的案例,而高维模型的研究刚刚开始。实际上,大量的实际问题和科学问题仍然需要通过面板数据,矩阵数据,矩阵序列数据和高维数据的分析方法来解决。面板数据包含对同一公司或个人在多个时间段内获得的多个现象的观察结果,因此如果获得面板数据,则个人和指标都可以被聚类。面板数据聚类是决策和专家分析中不可缺少的组成部分。

1.3本文解决方案

为解决上述问题,本文提出了基于AGRA模型的面板数据聚类方法。如图1右列所示,该模型的总体思路是先对原始时间序列进行变换,得到累积序列,然后进行仿真。然后,使用前面的模拟函数可以获得的所有样本的生成速率序列被用来计算灰色关联度。 AGRA模型由三种灰关联度组成。如图1右列底部的矩形所示,使用Mean-AGRA模型进行聚类计算。

如图1左侧所示,纸张结构如下。第二部分研究了数据转换。第三部分建立了面板数据AGRA模型。接下来,在第4节中,提出了基于AGRA模型的面板数据聚类方法,并给出了面板数据的Mean-AGRA聚类方法所遵循的步骤。第5节提供了使用该模型的应用程序,第6节提出了适当的结论。

原始面板数据

第2节

获取相对世代率序列

计算灰色关联度,灰色关联度和灰色关联度

第3节

计算重量参数

gamma;DE,gamma;DI和gamma;VA

获得AGRA模型的灰色关联度!

第4节

参见第5节中的案例研究

洞察

比较每对样品

聚类计算

根据Mean-AGRA聚类方法对所有样本进行聚类

数据转换

模拟累积序列

获取累积序列

2.面板数据的数据转换

在本节中将定义有关面板数据转换的一些基本概念。这些定义需要在后续章节中建立AGRA模型。

定义1(面板数据)在时间,样本的指标的值为。那么,包含样本的个指标时间序列的矩阵是

面板数据构成所有样本的矩阵表示。

对GRA模型的研究表明,现有的关系模型在给定的时间序列原始观测数据中可能不能保留某些数学特征,如“指标性质”和“内在性质”。从灰色系统的角度来看,虽然一个特定的系统似乎是复杂的,但系统总是具有一个操作能力或功能,并遵循固有的规律。实际上,有一种叫做灰色生成的方法,可以从系统的观察中反映出来,探索原始系统的内在属性。积累生成是一种有效的灰色生成方式,使灰色过程变白,揭示积累过程中的发展趋势或趋势。原始数据可能看起来并不遵循规律,但是由于累积产生的综合特征而出现。由于经济,生态和农业系统可以看作是广义的能源系统,而且能量的积累遵循指数规律,所以积累的产生在很多领域得到了广泛的应用。

指标i对于样本s的原始值为可以得到方程(1)通过GM(1,1)模型(Liu 等人,2004)。

(1)

此时

(2)

(3)

(4)

( (5)

(6)

在这项研究中,时间处的的切线的斜率可以作为导数得到:

(7)

可以计算出之间的平均值,得到方程(8)。

(8)

斜率是线的倾斜的度量。在时刻的切线斜率是在时刻的导数值,即时间。然后,切线的斜率除以平均值以建立相对生成率。生成速率序列之间的差异反映了原始序列中趋势变化的相似性。生成率越接近原始序列的关联度越大。

定义2(相对生成率)时刻的相对生成率定义为方程(9),其中。

(9)

定义3(平均相对生成率)的平均相对生成率定义为方程(10):

(10)

定义4(样本的平均相对生成率的序列)。的平均相对生成率序列称为样本的平均相对生成率序列,可写为。

3.建立面板数据的AGRA模型

样本的相似度用本研究下面定义的样本平均相对生成率序列的偏离度,差异度和分离度来表示。矢量角用于度量偏差度;利用平均相对生成率之间的差值来计算差异度;用分离系数来衡量分离度。现在提供详细的定义。

定义5.(偏离度)设样本的平均相对生成率为偏差程度在样本,之间是:

(11)

定义6.(差值)对于样本,

之间的差值给出如下:

(12)

样本之间的差异程度是差值的平均值,计算方程如下:

(13)

定义7.(分离度)样本之间的分离度是定义如下:

(14)

其次,构造了定义8给出的灰色背离关联度,灰色差异关联度和灰色分离关联度。

定义8(灰色背离关联度,灰色差异关联度和灰色分离关联度)。这三种联度,即灰色背离关联度,灰色差异关联度和灰色分离关联度分别为:

(15)

(16)

(17)

定义9.(AGRA模型)基于累积生成的灰关联度(AGRA模型)将灰度关联度,灰度差关系度和灰度分离关联度组合成如下方程:

(18)

其中。

可以使用两种方法来确定由方程(18)中的,和给出的权重参数。一种方法是为每个参数简单地为每个权重参数(例如1/3)分配特定值。这项任务是基于对所研究问题的实际知识。第二种方法是解决优化问题,如下所述:

max (19)

受制于

(20)

上述优化问题可以用下面的拉格朗日乘子法来解决:

(21)

将偏导数设为零可以得到:

(22)

以上可以等效地写成:

(23)

这里有

(24)

(25)

(26)

(27)

(28)

(29)lt;

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[23610],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版