1. 研究目的与意义
造纸是我国四大发明之一,对人类科学文明的发展作出了重要贡献,这是特别值得自豪的事情,同时造纸工业在我国国民经济中也占据着十分重要的地位,是一个与我们的生活密切相关的行业。但是,造纸工业的水污染也特别严重。随着经济的发展,工业的兴起,水资源污染越来越严重,人类面临着严重的水资源匮乏问题。据环保部门统计[1],2008年全国工业总耗新鲜水量549.63亿吨,其中工业污水总排放量217.38亿吨,其中工业cod总排放量404.8万吨。可以看出全国工业污水的处理和排放情况任然很不乐观[2]。工业污水处理效果的好坏对自然环境及人类生存环境的影响也相当大,处理不当直接威胁到人类的健康;再者工业污水处理的运行费用非常庞大,如果通过有效的控制即使将污水处理厂的运行费用节省1%,也将带来可观的经济效益。因此,加强对工业污水处理监控系统的研究和开发将显得非常必要和迫切[3]。
现代工业过程趋于复杂化,过程变量也越来越多,要想保证过程正常运行、提高产品质量就需要测量很多过程变量用于过程监控[4]。工业自动化生产中集散系统的广泛应用,使得大量的生产过程数据得以保存和记录。一方面,大量的数据中蕴含着能够反映生产状况的丰富信息,对过程监控有重要的利用价值。另一方面,采集到的数据往往包含各种扰动产生的噪声,而且变量本身又存在严重的相关性,因此无法简单使用。于是,如何采用各种数据分析和处理的方法从采集到的海量数据中挖掘出有用的信息,从而对生产过程中出现的各种异常情况作出有效的反应,成为理论和工业实践中有待于解决的重要问题,因此将统计理论应用到监控系统中而提出的多元统计监控方法成为近年来的研究热点[5]。
多变量统计过程监控方法主要包括主元分析(pca)、费舍尔判别分析法(fda)、偏最小二乘法(pls)、独立成分分析(ica)等。在研究人员对各个方法进行改进之后,chiang通过te过程(tennessee eastman process)比较了fda、pca和pls方法的错分率,结果显示基于fda的方法由于pls和pca[6,7]。
2. 国内外研究现状分析
1962年,wilks等提出经典的fisher判别法。后来被swets、belhumeur和liu等人应用于人脸识别问题。1975年,foley和sammon建立了f-s线性鉴别法。1988年,duchene等进一步拓展了这一方法,实现了多类模式的分类,给出了最优判别向量集的结果。同年,tian将其用在图像识别领域。近几年,由jin和yang等提出的具有统计不相关性j-y线性判别法。yang提出了最优组合判别矢量集方法。2001年,yu和yang又提出了直接线性判别分析,得到了不错的研究成果[15]。
在国内,2000年,王明兰利用fisher判别法确定胶料中炭黑分散性,得到很好的成绩[16]。2003年,张焱、汤强等将fisher判别法引入到川金丝猴亚种鉴定中,为此提供了一种简捷、有效的数值分类方法[17]。2004年,钟绍军、叶小青等将fisher判别法引入乳房癌诊断中[18]。2009年,李秀珍、王成华等用fisher判别法有效地预防了山体滑坡并成功减少滑坡造成的危害[15]。
所以,fisher判别分析法在造纸废水处理过程监控研究中,一定也可以起到很好的作用。但是传统的fisher判别分析法已经跟不上科学技术的发展了,所以很多研究人员对fisher判别法进行了改进,比如针对间歇过程监控的特点,将核方法引入到fisher判别分析中,提出了基于核fisher判别分析(kfda)的间歇过程性能监控与故障诊断法;针对质量估计和预测过程中由于仪表错误或过程泄漏等原因造成的过失误差及故障问题,将模式识别中的fisher判别分析法引入过程显著误差侦破和故障监测,提出了基于fisher判别分析和核回归的质量监控和估计方法[19];针对间歇过程监控,还提出了多向fisher判别分析法(mfda);为了实现有效的故障分离,提出了融合fda特征提取、fisher线性分类和svdd非线性核空间等的模式分类算法(fda-svdd)[20]等。
3. 研究的基本内容与计划
研究内容:基于费舍尔判别分析算法的造纸废水处理过程监测研究
研究计划:
(1)使用费舍尔判别分析算法(fda)对造纸废水处理厂实际数据(包含8个变量,170组数据),进行建模仿真,处理数据。
(2)学习使用matlab的统计工具箱,处理数据并作图,验证费舍尔判别分析算法在过程检测中的实现过程。
4. 研究创新点
费舍尔判别分析法(FDA)最早由Fisher于1936年提出,基本思想就是从特征抽取的角度分析最优的投影方向,使得作为投影轴的一维鉴别矢量能将两类模式最大程度的加以区分。Fisher方法的目标是求出一个最优(或一组最优)投影轴组成鉴别矢量(集),使得各类样本投影到该空间后能在确保方差最小的情况下,实现不同类样本的有效分离。将体现不同类数据均值之间差别的量称为类间方差(或类间离散度矩阵);而体现同类别内这些均值与周围数据差别的量称为类内方差(或类内离散度矩阵)。Fisher判决方法就可以概括为:寻找一个或一组投影轴,通过线性变换实现类内方差最小化的同时类间方差最大化[5]。
费舍尔判别分析属于模式识别领域,是一种广泛应用的线性减维技术,也是特征提取的最好方法之一[8]。传统FDA算法实现的是寻找使Fisher目标函数最大化的最优鉴别矢量, 其分类依据是通过选择让Fisher准则函数达到极大值的最佳鉴别矢量作为投影方向,使得样本数据在该矢量方向上的投影具有最大的类间离散程度和最小的类内离散程度[9]。由此高维数据空间就可以通过投影到寻优获得的最优判别方向上组成一个低维特征空间,在该特征空间中,不同类的数据能得到最大程度的分离[5]。
