基于近红外光谱技术和化学计量学的绿茶质量自动分 级外文翻译资料

 2022-12-04 15:34:36

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


基于近红外光谱技术和化学计量学的绿茶质量自动分

1 简介

茶是世界上最受欢迎的饮料之一,并因为它对身体的益处而广受欢迎。根据发酵程度,茶一般可以分为三种类型:不经发酵,发酵部分,充分发酵。虽然在中国所有的上述三种类型的茶叶都被人们生产和消费,但是绿茶因为其特殊的风味和口感最受欢迎。

龙井茶和绿茶产自杭州和周边地区,从古至今都被人们看作是高级的茶叶不仅是因为其优秀的质量更是因为它有着深远的文化背景。龙井茶叶在烤后不久停止自然氧化过程。浸泡时平叶和直叶产生黄绿色的颜色。其味道非常柔和甘甜,它是儿茶素含量最高的茶叶,同时儿茶素也是一个高品质的绿茶的重要指标。

因为龙井茶有很高的商业价值,为了控制龙井茶的质量必须对各种假冒龙井茶叶进行分辨。对龙井茶叶进行内部分级是控制茶叶质量的基础。作为一个受到地理标识保护的绿茶,三个龙井茶叶的生产地被明确的分为杭州,钱塘江和越州,很长的一段时间内龙井的质量被认为可以通过他们的产地来区分。因此,有必要开发一种快速、有效的方法来区分不同等级的龙井茶的方法。

近期,近红外(NIR)光谱法已广泛应用于食品质量控制。与传统分析方法相比,近红外光谱有以下几个优点: (1)减少了样品制备,劳动力,和分析的成本;(2)有无损和在线分析的潜质;(3)综合表征多种主分。然而,因为近红外光谱往往有着低光谱分辨率和严重峰重叠的特征,化学计量学方法要求从食品质量中提取有用的信息测量信号。在各种模式识别技术中,分类方法是最常用的。一些常用的分类或分析方法包括支持向量机(SVMs),K-近邻(KNN),线性判别分析(LDA),和偏最小二乘判别分析(PLSDA)。

本文旨在开发一种通过使用近红外光谱学和偏最小二乘法来快速分析方法分级龙井茶的方法。不同的数据预处理方法包括平滑法,用二阶导数法,和标准正态变量 (SNV)变换,在化学计量学的模型被开发之前这些方法被用于减少同级茶叶样本中的不必要的光谱变化。

2。实验和方法

2.1茶叶样品和近红外光谱分析。

从当地的茶树上收集三种等级的龙井茶的总共2745个样本。关于样品的详细信息如表1中所示。所有的样本在近红外光谱分析之前都被存储在阴凉黑暗,干燥的地方。使用TENSOR37傅里叶变换近红外光谱仪对茶叶进行无损的近红外光谱分析光谱波长范围4000 - 12000 cmminus;1。每个样品被放置于没有经过任何预处理的石英杯子中测量。使用OPUS软件对于每一个样本在25∘C的条件下扫描32次,光谱分辨率为8 cmminus;1。增加扫描的数量并不能显著地改善信号。32次扫描的平均值保存为原始光谱进行化学计量学分析。

表1 龙井茶叶的不同等级

2.2异常值诊断、数据分割、PLSDA。

离群值是偏离了大部分样本值的反常值。对于分类,异常值不仅会导致模型的偏差和误差,也会导致对模型错误的估计。考虑近红外光谱多元化的性质,为了避免多个离群值的掩蔽效应,健壮的诊断和降维技术适合于检测近红外光谱的异常。Stahel—Donoho估计(SDE)的孤立度被用于诊断各个等级的龙井茶叶的离群值。SDE项目将各个高维样本多次随机映射到选择的方向。每个对象的SDE孤立度可以使用中位数和分散的计算估计(绝对中位差)来计算。一个特别大的SDE孤立值的对象会被判定为异常值并被删除,在本文中预测数为500。

将离群值剔除后,使用 K-S算法将测量数据划分到训练集和预测集。K-S算法能够选择出一个均匀地分散在训练对象的范围内的预测集。因为三个级别龙井茶叶的分布不同,K-S算法对每一个等级的茶叶进行单独执行。

假设有一个的矩阵,在光谱范围内有个波长分别对应这个训练对象,为了对各个种类进行分类,n是从A个等级的样本中收集的样本总数(在本文中A=3)。响应矩阵()被设计为和矩阵中的每个对象的类别相一致,响应矩阵中的所有的元素被初始化为-1,如果一个对象i(i= 1 :N)分类为J(J = 1:A),则将响应矩阵的第i行第j列元素设置为1。然后可以开发出一个偏最小二乘法的模型,并通过矩阵以预测响应矩阵的每一个列,如果一个对象的第 j个种类(j= 1:A)的预测响应向量大于0的话,这个新的对象将会被分类为j。

图 1 典型的未经处理的三个质量品级的龙井茶叶的近红外光谱图

2.3.模型验证和评估

对偏最小二乘法,一个重要参数是潜在变量的数量或模型的复杂性。太多的潜变量将导致模型的过度拟合和一个很差的泛化性能,然而过少的潜在变量也会导致模型的不充分拟合。在本文中,蒙特卡罗交叉验证被用来选择偏最小二乘法模型中的潜在变量的数量。偏最小二乘法的成分的数量估计为蒙特卡罗交叉验证的平均错误率最小化时的结果:

k是MCCV数据拆分数量的整数倍,是预测样本的数量,是错误分类的数量

比较分类模型的性能,每个等级茶叶的敏感性和特异性的测试集计算为

TP,FN、TN和FP表示true positives,false negatives,true negatives,false postives。在本文中每个等级的对象会被标记为正数,其他的两个等级会被标记为负数。

3.结果与讨论

图1中展示了典型的未经处理的三个质量品级的龙井茶叶的近红外光谱图。从图1 中可以看出三种等级的龙井的原始光谱具有非常相似的吸收模式,并且信号的特点是低吸光度和基线。在每一个等级,光谱有相当大的变化,可能与其他的等级的谱线重叠。因此,需要采取数据预处理减少每个品级的不必要的变化。图2演示了通过使用平滑法,用二阶导数法,和标准正态变量 (SNV)变换方法的光谱预处理,光谱平滑法似乎得到一个改进的信噪比,但无法移除基线数据。二阶导数光谱有增强的局部峰的差异,例如,7200cm-1左右。SNV似乎可以消除大部分的内部等级的变化。

图3展示了三个质量等级龙井的SDE 孤立度诊断图。根据规则,一个SDE值大于3的话就会被判断为离群值。4,9,和20个对象被从三个等级的样本中分别移除,分别为。因此,461,891,和1360个对象被分别留在了一,二,三,三个等级中。调查数据预处理对分类性能的作用,所有的偏最小二乘模型训练和测试都使用了的相同的数据集。K-S算法被执行于各等级的原始数据以获得训练和测试对象。最后,训练集包含1800个对象(Ⅰ级,300,Ⅱ级,600,Ⅲ级,900)用于训练和912个样本对象(Ⅰ级,161,Ⅱ级,291,Ⅲ级,460)用于预测。

使用不同的预处理方法,开发出偏最小二乘法的模型,执行蒙特卡罗交叉验证估算出潜在变量的数量。对于算法,原来的训练集将被随机分为训练集(50%)和预测集(50%)为20次。使用不同的预处理方法所得到的PLSDA的分类结果和模型参数汇总在表2。从表2看出,经过D2和SNV预处理后得到的光谱数据与原始的和平滑法后的光谱相比预测精度显著提高。最好的分类模型通过snv-plsda得到,一级,二级,三级龙井茶叶的灵敏度/特异性 分别是1.000/0.979,0.955/0.952,0.924/0.996。图4展示了采用不同的预处理方法后得出的错误率。对于大多数模型,茶叶各等级分类的敏感性和特异性均高于0.9,说明近红外光谱能够有效地对龙井茶叶进行分类。此外,D2(二阶导数法)和SNV(标准正态变换)能通过消除部分的基线和散射的影响从而减少不必要的差异;因此,D2(二阶导数法)和SNV(标准正态变换)是光谱预处理的首选方案。

4.结论

使用近红外光谱分析和化学计量学能够快速可靠地对龙井茶叶进行内部质量分级。比较不同预处理方法表明了通过D2(二阶导数法)和SNV(标准正态变换)可以有效的减少各个等级龙井茶叶的不想要的光谱差异。近红外光谱分析和模式识别的方法展示无损、快速的对龙井茶叶进行内部质量分级的潜力。一个实际的问题是绿茶的化学组分随着季节和年份周期性变化。因此,未来的工作将是对不同季节和年份的龙井茶叶建立质量控制模型。

5作者的贡献

在这项研究中,X –S,Fu和L.Xu都有着非常大的贡献。

6鸣谢

作者感谢来自于中国国家公益性产业项目(编号:201210010,201210092,2012104019),国家自然中国科学基金会(31000357),杭州农业科技发展规划(20101032b28),以及关键的科学和技术浙江省创新团队项目(编号:2010r50028)的经济支持。

图2通过使用平滑法,用二阶导数法,和标准正态变量 (SNV)变换方法的光谱预处理

图3展示了三个质量等级龙井的SDE 孤立度诊断图

图4展示了采用不同的预处理方法后得出的错误率

7参考文献

Xu Q S, Liang Y Z. Monte Carlo cross validation[J]. Chemometrics amp; Intelligent Laboratory Systems, 2001, 56(56):1-11.

Lin J K, Lin C L, Liang Y C, et al. Survey of catechins, gallic acid, and methylxanthines in green, oolong, pu-erh, and black teas.[J]. Journal of Agricultural amp; Food Chemistry, 1998, 46(9):3635-3642.

Marx C W, Iii G E D, Cheney C, et al. Do estrogens improve bone mineral density in osteoporotic women over age 65?[J]. Journal of Bone amp; Mineral Research, 1992, 7(11):1275–1279.

Aelst S V, Vandervieren E, Willems G. A Stahel–Donoho estimator based on huberized outlyingness[J]. Computational Statistics amp; Data Analysis, 2012, 56(3):531-542.

Mckenzie J S, Jurado J M, Pablos F D. Characterisation of tea leaves according to their total mineral content by means of probabilistic neural networks[J]. Food Chemistry, 2010, 123(3):859-864.

Tao S, Chen D, Zhao W. Fast pruning algorithm for multi-output LS-SVM and its application in chemical pattern classification[J]. Chemometrics amp; Intelligent Laboratory Systems, 2009, 96(1):63-69.

Lu X, De-Hua D, Chen-Bo C. Predicting the age and type of tuocha tea by fourier transform infrared spectroscopy and chemometric data analysis.[J]. Journal of Agricultural amp; Food Chemistry, 2011, 59(19):10461-9.

Xu L ,, Cai C B, Cui H F, et al. Rapid discrimination of pork in Halal and non-Halal Chinese ham sausages by Fourier transform infrared (FTIR) spectroscopy and chemometrics.[J]. Meat Science, 2012, 92(4):506-510.

8引证文献

Dong Y, Liu X, Liang M, et al. LED-induced fluorescence system for tea classification and quality assessment[J]. Journal of Food Engineering, 2014, 137(8):95-100.

Yan S M, Liu J P, Xu L, et al. Rapid discrimination of the geographical origins of an oolong tea (anxi-tieguanyin) by near-infrared spectroscopy and partial least squares discriminant analysis.[J]. Journal of Analytical Methods in Chemistry, 2014, 2014:704971-704971.

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[28920],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版