基于主成分分析的成熟菜豆的差异性研究外文翻译资料

 2023-01-12 09:01

基于主成分分析的成熟菜豆的差异性研究

原文作者 Mirjana V, Jelica G, Janko 单位Genetika,

摘要:我们对所采收的大豆进行了差异性研究。研究范指标包括大豆的两类性质特点、颜色、形状、以及13种特征,也就是大豆的3类株高,5种产量和5种化学特性。利用主成分分析(PCA)可以分析出哪种特性在基因变异中处于决定性的作用。通过相关矩阵构造出主成分,以每种特性指标在主轴上的旋转后和未旋转的载荷量表示出主成分。每一个选出来的主成分都显示出了自己对总方差的贡献率,结合之前的主成分,可以看到所有主成分累积的方差贡献率。基于7个主成分来解释所有的变异方差,第一主成分可以定为基因生产力,第二主成分定为大豆形状,第三主成分定义为大豆尺寸,第四主成分定为基因产量,最后三个定为大豆的化学成分。

关键词:差异;性质特点和数量特点;主成分分析;菜豆

引言

在研究中心建立了菜豆基因型的收集,用来处理菜豆繁殖问题。所收集的菜豆包含了所有具有市场利润的菜豆颜色的基因型,菜豆采集组织同样考虑到培育种植一些重要的具有市场价值的菜豆种类。建立菜豆集合类,目的是研究基因型的变异差,以便从总体中选出最适合培育、杂交以及挑选的准线。当培育一组生长条件特殊的菜豆时,了解和利用“局域种群”

是非常重要的,因为在这样的总体中,产量构成部分之间的联系是平衡的,并且是与这些特殊的气候和土壤因素的影响相适应的。主成分分析是一种多变量的分析方法,利用主成分分析可以得出那种特性在基因型变异中处于决定性位置。通过主成分分析可以发现和解释不同特性,从而更容易去理解这些特性的作用和联系。

材料和研究方法

对于收集的菜豆的差异性,我们已经研究了三年。 菜豆的差异表现出一部分位于诺维萨德田地与蔬菜作物机构的种质短期保存材料。此项研究包括了菜豆的两种特性,菜豆的颜色和形状以及13种特征,也就是大豆的3类株高,5种产量和5种化学特性。

根据HUSSANI 等人的理论,我们将菜豆的每种颜色和形状用数字代码标注,以方便计算研究。主成分分析基于的是Pearson相关矩阵和欧几里得距离。所有主成分的本征值和本征向量都可以计算出来。所选出的主成分对总方差的贡献率同样可以得出,结合之前的主成分,可以看到所有主成分累积的方差贡献率。收集的菜豆的变异性可以通过7个主成分来解释。旋转后的和未旋转的本征向量值也可以得到。最大方差法用来计算旋转后的主成分。

主成分分析的整个计算运行过程由统计软件SYSTAT完成,即STATS模块。

结果与分析

有相关矩阵算出主成分的个数是15个(表1),个数与观察的特性指标个数相近。第一主成分的方差贡献率大,变异主要集中在第一主成分上。前三个主成分对总体的方差贡献率都超过了10%,后面的一直到第7个主成分,其对总方差的贡献率超过了5%。最后三个主成分对总方差的贡献率很小,忽略不计。

对于选择用于接下来分析的主成分时,我们有一定的数值标准,大多是情况下是依据主成分特征值的大小或者是以百分比形式的累计共因子方差。第四个主成分以后的本征值即特征根都小于1。而前四个主成分的累积方差贡献率约为70%,并没有完全覆盖菜都集合中的差异性。只有能解释总方差的约90%变异性才能符合我们的要求,这也就是为什么我们要选择前7个主成分用于我们以后的分析。累计公因子方差表明前7个主成分的方差贡献率达到了87.1%。本征值即特征根的值介于第一主成分的5.96与第七主成分的0.77之间。

7个主成分用未旋转的指标量表示出来。某些特征指标与仅一个主成分的相关系数很高,更多的主成分与特征指标的相关系数还是很小的(表2)。

超过一半以上的特征指标包含在第一主成分中,且与其他主成分和特征指标相关性很弱,这使得主成分旋转变换更加满足条件需要。

大多数情况下,主成分旋转的个数依据用于接下来分析的主成分个数。在此案例分析中,也是七个主成分都被旋转变换。用这种方法,我们可以看到这些主成分中个指标特征清楚的分布,并且特征指标与特定的主成分的相关程度很高,旋转之后累计公因子方差仍保持87%。

由于第一主成分包含了决定产量水平的显著因子,所以可以将第一主成分命名为生产能力。与第一主成分相关程度最高的是豆荚中的豆子个数、菜豆重量和每单位面积土地中菜豆的产量。对于高产量的植株来说,植株的高度对产量的作用占很小一部分。除此之外,菜豆的颜色和菜豆油脂含量与第一主成分的相关性也很小。在研究过的菜豆中,这些特征都很大程度上参与了变异性,并且在方差变异中占了很大比例(表3)。用主成分来分析基因型变异,我们用每单位面积豆子的产量和产量的高度以及豆油高含量指标挑选出产量的基因型。即使是包含在豆子颜色的多变量分析中,很显然,在这些实验的菜豆中具有最高数值量的黑白豆子颜色的基因型具有很高的产量值。在不同的样本和基因型中,这种关系并不会一定出现,因为豆子颜色并不是以这种方式与第一主成分相联系。

第二主成分可以命名为菜豆形状,并且第二主成分在基因型测试中占了大部分的方差。菜豆形状是豆子性质指标中最显著的特征之一,这也是粮食市场中菜豆的特点之一。选择渠道依据的是菜豆的大小,这也是为什么基因选择是根据所有豆子的形状所呈现出来的样子。由于基因型的不同,用它代替之前菜豆规格分布情况。

第三主成分包含了直接与豆子产量相联系成分。它结合了生产力的解释和菜豆的质量。与第三主成分有很强相关性的特征指标有:豆荚的含豆量、每单位的豆子产量,都是很重要的生产力因素,同样1000颗豆子的质量也是豆子品质的决定性特征指标。考虑到豆子的大小与第三主成分成反方向的相关关系,它可以被用来区别1000颗豆子高质量和每颗豆荚中少量的豆子个数即在很大比例上每单位的菜豆产量很少量,并且豆子形状小的基因型的豆子,其每个豆荚中的个数却很多。

第四主成分可以很大程度上定义为基因型产量稳定性,因为它包含了最大比例的在豆荚高度影响下的豆荚长度。在接下来的三个主成分中,种子的化学构成成份的影响是显著的。第五主成分与菜豆的淀粉含量指标相关程度较高。同样,第七主成分与菜豆的蛋白质指标相关程度较高,第六主成分与菜豆的纤维素指标含量相关程度较高。由于这些主成分都是互不相关的,其他的特性指标在最的三个主成分上的载荷量都是很低的。

在阿库瓦等人的关于培育成熟菜豆基因型著作中,在研究调查菜豆结构和豆种大小时,这些特性中的一些,例如豆子的重量、每个植株的豆子采集量,都是被标记为重要指标的。结合主成分分析可以在培育中,正确挑选出一种或一种以上特性的适合基因型。

外文文献出处:Mirjana V, Jelica G, Janko . Divergence in the dry bean collection by Principal Component Analysis (PCA)[J]. Genetika, 2008.

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[287105],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。