

英语原文共 26 页,剩余内容已隐藏,支付完成后下载完整资料
基于粗糙集理论的一种新的属性约简算法应用于船舶燃油消耗分析
关键词:粗糙集,条件属性,决策属性,属性减少,属性意义,绝对核心,不可信性关系,相对减少,上近似,下近似
摘要
粗糙集理论的主要思想是通过在保持分类能力的前提下减少属性和减少价值来提取决策规则。 本文提出了一种用于定义属性重要性的新方法。 该方法通过与属性重要性改进算法的大小进行比较,考虑绝对核算法在保持正区域不变条件下的定义。 该算法可以降低计算复杂度并提高计算效率。 所提出的算法应用于船舶燃料。消耗数据分析,模拟实验表明该算法更有效。
介绍
粗糙集理论,在1982年由Pawlak 提出,已被证明是一个强大的工具,用于处理不完整和不精确的问题或模糊的知识。它作为一种新的软计算方法,理论越来越成熟,也引起了外界的广泛关注。现在粗略集理论广泛应用于各种领域,如机器学习,模式识别,数据分析等。其主要思想是在分类能力不变的前提下,通过知识减少,决策出口问题和分类规则。到目前为止,还没有一种有效的方法来生成最优的性格减少。对于实际应用来说,足以产生相对减少。不幸的是,S.K.M. Wong和W. Ziarko [2]证明了获得所有最小属性减少的问题是非确定性多项式难题。
多年来,许多启发式算法已经被提出了。参考文献[3]是基于碎片矩阵的算法,它可以很容易地计算还原和核。通过引入差分函数,应用布尔代数分布定律和吸收衰减定律,从而得到该差函数的漏模型;参考文献[4]是算法结合粗糙集理论和模糊理论。 Pawlak提出了获得核心属性拳头的想法,然后添加另一个。 Jolonk [5]提出了一种基于其意义来添加属性的方法以核心属性为起点,通过计算获得属性重要性。在真实问题中,每个属性的重要程度不同。该算法实际上选择了最大属性重要性的减少过程。 Guoyin W.和其他人[6]提出了基于信息熵的属性约简算法。算法在决策表中定义信息的重要性,并作为启发式信息,减少缩减过程中的搜索空间。天云Z.和Douqian M. [7]分析二进制区分矩阵,并基于二进制区分矩阵给出属性简化算法。根据算法可以区分决策表是否一致。与一般的区分矩阵相比,二进制区分矩阵可以节省存储空间。
在本文中,我们根据分类知识发现模型强调决策表的属性减少。重新定义属性意义的概念,结合绝对核心的求解方法给出属性约简算法。说明性示例示出了该方法的验证
粗糙集的相关的理论
粗糙集有效的数据分析技术,没有任何预先知识的情况下,挖掘出重要的数据或规则,而且规则易于理解,操作形式基于粗糙集。
关于对象的知识通常以信息表的形式表示,表的行由对象标记,列由属性标记,并且表的条目是称为描述符的属性值。 相关定义如下:
定义1:通常来说,信息系统可以被考虑为一个系统S = (U, A,V, f), U ={x1,x2,......, xm}是整体。A=CU是属性的集合, 子集C和D分别是条件和决策属性的不相交集合。
V=, 其中是属性a的域,并且f:U是一个总函数。称为信息函数,是一组有限的属性。
定义2:对于每一组属性,在下面定义可信性关系i-nd {P),如果,则所述x,y是相对于P.的不可分性关系。对于U的任何元素x,关系i-nd {P}中的x的等价类被表示为:ij(P)的等价类被表示为基本集的构造是用粗糙集分类的第一步。 由P确定的分区表示为U / ind(p)(缩写为U / P)。
定义3:数据分析的粗略集方法取决于两个基本概念,即集合的下近似和上近似,令X表示宇宙元素的子集(X匚⑺).X的较低和近似表示为:
称为正区域,也就是说,根据知识判断R必须属于X个元素集合,根据知识判断可以属于该组元素。称为负域的X是宇宙的不可判定的区域。如果属性集是依赖的,则可以感兴趣于找到属性的所有可能的最小子集,这导致与整个属性集合集合相同数量的基本集合以及找到所有不可缺少属性的集合(核心)
约简属性的基本概念
众所周知,知识库中的知识不是同等重要,甚至其中一些是多余的。 所谓的属性约简是去除不确定的或不重要的知识在决策表中。属性约简是粗糙集的关键和最有价值的部分。 属性值减少很大程度上影响分类规则。 通过减少过程,属性数量将减少,并且考虑相应的分类规则越来越少。 当多个属性减少与相同的最小数量时,这里得到最佳减少。
在已知的系统S = (U,A,V, f)中,条件属性集合C的减少P是C的非空子集。如果 则将P称为C的还原。一般来说,决策表的相对减少不是唯一的,即,决策表可以具有多于一个属性减少,并且这些减少集是等价的。
定义4:集R是宗族等价关系,,如果,则r在R中是不必要的,否则称为r必需的。 如果每个r在R中是必需的,R被称为独立的; 否则就称R为依赖。 为了检查属性集是否是独立的,检查每个属性是否其删除增加了基本集的数目是否在R中
定理1: 如果R是独立的,,则P也是独立的。
定义5:集合,如果Q是独立的,并且,那么Q是P的还原。
显然P具有多重还原。 P中所有必要关系的集合称为P的核,由core(P)表示。
核和还原具有以下关系:
定理2:,这里全部是关于P的还原。
在应用中,类别相对于另一个关系的分类是非常重要的,因此我们将介绍知识和相对核心的相对减少概念。 首先,定义一个相对于另一个类的类是一个分类的域。
定义6:假设P和Q是等价关系的族,P的正区域标记
定义7:假设P和Q是等价关系的族,
那么R在P中是不必要的,否则在P中R是Q必需的。
为了简单起见,我们也使用代替 如果P的每个R是必要的,则P称为Q的独立。
集合,当且仅当S是独立子组时,S是P的Q还原,且 P对Q的减少被称为相对减少。 关于Q的所有必要的原始关系构成P中的相对核心,参考。
定理3:,其中是P对Q的所有还原的集合。所有与P中的Q相关的归约积分称为相对核,定义为
基于属性重要性的减少算法
在大多数启发式减少算法中,通过分类能力来测量参考决策属性的条件属性的重要性。 目前广泛采用的属性约简算法用于属性约简的属性重要性[8,9],通过计算每个属性的信息量或计算属性的有效性来寻找信息表的最大影响属性。 减少或不产生对属性信息表的影响,并获得属性减少。 它可以不需要寻求核值,使得算法更一般,因此已被广泛使用。 在本文中,通过使用属性重要性来找到决策表的属性减少。
在决策系统中,条件属性和决策属性的关系程度真实反映了真实反映条件属性的重要性的条件属性的重要性[10]。当条件c达到一定的属性值Vc时, q的决策属性的可能值的数量可以响应条件属性的重要性。 如果c的条件属性值是唯一的,条件属性只能确定决策属性,然后直接生成规则,不需要其他条件属性。 如果条件属性不是唯一的,我们根据属性重要性的概念将条件属性的小重要性排除。
下面给出新属性重要性的新定义,
是的数量,条件属性值的样本数可以使得,当c实现条件属性值Vci时,所有决策属性分类号; 与Vc数量参数的值相关,其大小随着U的增加而增大。根据上述定义,我们可以确定当Mc的值越大决策属性条件属性的能力越强。
定理4:若,那么有
定理5:相对核的集合的子集是绝对的。
定理6:设都是对应于信息表集合的决策表的减少,且是所有减少决策表的集合。那么对于,有
现在我们给出减少的算法:
输入:决策表其中C是条件属性的有限集合,D是决策属性的有限集合。
输出:A相对B减少
步骤1:构造条件属性和决策属性的二维决策表;
步骤2:确保数据分类标准,消除冗余属性;
步骤3:根据公式计算属性重要性;
步骤4:计算绝对核心属性B。计算决策表,且使绝对核
计算,若,然后将条件属性加入绝对核心。相对核是相对降低的集合的子集,绝对核是相对核的集合的子集。 但是当我们在决策表的属性减少时,如果找出相对核心,应该如何继续下去。
步骤5:计算在绝对核的基础上添加必要的条件属性。若,解释绝对核心的属性已经包含所有重要的条件属性。 在这种情况下,只需要进一步减少条件属性。假设删除B1的条件属性,当,我们可以对Bl的条件属性减少。
步骤6:若我们在绝对核的基础上增加了必要的条件属性:通过解决
将大属性和绝对核心属性的相关系数合并为新的条件属性,得到属性减少结果。
属性重要性和相关系数的缩减算法不需要为属性的每个组合计算用于决策属性的正区域。 因此降低了计算时间的复杂性。
模拟实验
近年来,由于油价上涨导致航运公司尽力采取有效的方法降低成本。 例如,通过各种渠道进行电气和机械设备的维护,采矿和节能,使用技术节省以减少船舶的燃料消耗。 首先确定消费决策属性数据和条件属性:
船舶操作燃料分析是一个复杂的过程。 有许多因素可以影响船舶的燃料消耗。 主要包括航道(B1),天气(B2),速度(B3),压力(B4),风速(B5),波浪,水平(B6),温度(B7),平均速度和主发动机转速 为了有效制定合理的节约措施,降低燃油消耗,我们需要采取有效的方法来分析影响燃油消耗的因素。
条件属性集为C = {B1,B2,B3,B4,B5,B6,B7},决策属性集D ={D}
B1:1高,2低
Bl:1-顺风,2-逆风
B3:1高,2低
B4:0-晴天,l-多云,2-多云,3-雨,
4-射线,5-雾,6-阵雨,7-雾
B5:1高,2低
B6:无波,2-微波3-西,4-小波,
5 - 慢潮,6-大浪,7-浪涌,8-野浪,9-大浪
B7:1-平静,2-光风,3-微风,4-微风,5-温柔
微风,6-光,7-强风,8-强风,9-强风10-强风,11-狂风,12-风暴,
13 - 飓风。
我们构建船舶燃料消耗的决策表:
表。 船舶燃料消耗决策表。
使用提出的方法,基于粗糙集理论简化决策表。 根据显着性公式的新定义,计算每个条件属性的重要性:
基于上述计算:
当时,可以获得同样的结果。 类似地,我们可以获得:
通过上述方法可以得到绝对核,如下:B = {B1,B1,B3,B4,B7},有
因此,我们可以知道天气影响船舶操作中的最小燃料消耗,以及当风和海平面对于船舶操作消耗最大时,主机的温度,旋转速度。
下一步是删除较小属性值的属性。由于B1和B2具有最小属性值,因此我们删除这两个属性值。 但是对于,因此,这两个属性不能被删除。
结论
在本文中,给出了属性重要性的新定义。 然后提供一个算法结合概念的属性意义与绝对核。 通过属性重要性的排序,我们发现最小集合有相同的分辨率喜欢原始数据,最小集合是减少。 它可以不需要寻求核值,使得算法更一般,因此已被广泛使用。 所提出的算法适用于船舶燃料消耗讨论的导航。 仿真实验证明了算法的可行性和有效性。
粗糙集对船舶航行安全的应用是一个新的研究领域。 同时,它仍有许多问题有待解决。
致谢
本文的研究得到了国家自然科学基金(No. 61073134,No.51179020)的支持。 辽宁省教育厅重点实验室项目(N0.LS2010020)
参考文献
[1] Pawlak Z., (1982) “Rough sets”, International Journal of Information and Computer Science,11(5), pp. 341-356,
[2] S.K.M. Wong and W. Ziako(1985), 'On Optimal DecisionRules Tables”, Bulletion of the Polish Academy of SciencesMathematics, no. 33, pp. 9-10.
[3] Y.-S. Liu, M.-D. Wu, and D. Wang,(2007) 'A Fast Algorithmfor All the Minimum Attribute Reductions in Rough Sets”, Computer Engineering and Science, vol. 29, no. 1, pp.97-100.
[3] J. Richard and Q. Shen(2007), ^Fuzzy-Rough Sets Assisted Attribute Selection”,IEEE Transactions on Fuzzy systems, vol. 15, no. 1, pp. 73-89.
[4] Jelonek J, Krawiec K, Slowinski R. “Rough Set Reduction of Attributes and their domains for neural networks”. Computational Intelligence. Vol 2, pp. 339-347, 1995
[5] Guoyin W. ,Hong Y.and Dachun Y(2002)'The decision table r
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[139735],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
