

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料
基于神经网络和数据挖掘的财务预警模型
摘要:公司会定期披露反映公司经营状况的财务报表。其结果是,投资者只能在公司披露正式财务报表之后,才能得到关于公司可能会面临的财务困境的信息。如果公司的管理层为了隐瞒公司的实际经营状况而故意粉饰财务报表,那么投资者获得真实的财务信息的机会就更少了。例如,如果一家公司操纵其流动比率,使其高达200%,那么短期内该公司的流动性不足问题不足以说明该公司陷入财务困境。为了提高财务预警模型的准确性,本为以台湾证券交易所关于公司停止上市和暂时上市的规定为研究范围。此外,本文将财务比率和非财务比率相结合,运用因子分析法提取合适的变量。在其基础上,运用人工神经网络和数据挖掘技术来构建财务预警模型。基于37个指标,以68家上市公司为初始样本,进行了实证研究,并取得了令人满意的结果。结果表明本文构建的上市公司财务预警模型同时具备可行性和有效性。本文的研究做出了四个重要的贡献:(1)因子分析会降低人工神经网络和数据挖掘技术的准确性。(2)离公司真正陷入财务危机的时间越近,模型的预测精度越高。在公司陷入财务危机的两个季度以前,预测正确率为82.14%。(3)本文的实证研究表明因子分析会提高将财务危机公司判定为健康公司的错误率。(4)基于人工神经网络的财务预警模型优于基于数据挖掘集群的财务预警模型。综上,本文证明了在对一家公司的财务危机进行预测时,人工智能的方法比传统的统计学方法更合适。
关键词:财务预警模型;人工神经网络;数据挖掘
1研究背景
在台湾,国内外资本市场近几年来发展迅速,逐渐激发了人民进行金融投资的想法。金融投资的对象多种多样,如股票,期货,期权,债券型基金等。其中,股票投资是最受欢迎的。然而,资本市场是波动的,只有在公司公开披露财务报表之后,绝大多数投资者才会认识到公司正处于财务困境中。因此,预测公司的财务危机在当今社会发挥着越来越重要的作用,它对贷款决策和金融机构的盈利能力有着重要影响。对各类专业人士来说,如银行信贷员,债权人,股东,债券持有人,金融分析师,政府官员以及广大公众,准确预测公司破产的能力至关重要,因为这可以及时地向他们提供警告(Ko amp; Lin, 2006)。财务失败,通常是指企业遭受长期而又严重的损失或者资产不足以清偿其负债(Hua, Wang, Xu, Zhang, amp; Liang,2007)。财务失败的常见原因和具体表现包括:缺乏财务知识,未建立资本计划,债务管理不善,缺乏充分的应对突发事件的措施,难以坚持资本市场中的操作纪律。破产预测假设一个公司的财务报表恰当地反映了上述特点,到目前为止,已经有多种用于预测财务困境的分类方法,这些方法均采用源自财务报表的指标和数据。例如,单变量分析法(Beaver, 1966),多元方法,线性多元判别(MDA)(Altman, 1968; Altman, Edward,Haldeman, amp; Narayanan, 1977),多元回归法(Meyer amp; Pifer,1970),逻辑回归法(Dimitras, Zanakis, amp; Zopounidis, 1996),因子分析(Blum, 1974)和逐步回归(Laitinen amp; Laitinen,2000)。然而,传统的统计学方法要建立在严格的假设条件上,比如,各个变量之间要遵循线性分布和正态分布,各个变量之间是相互独立的。这使得其在现实中的运用受到了很大的限制(Hua et al., 2007).随着公司理财和全球经济环境翻天覆地的变化,一些主要的财务指标也产生了动态变化(John amp; Robert, 2001)。这意味着开发一种渐进的方法来应对未来动态的财务环境是重要且必要的。因此,本文在结合人工神经网络和数据挖掘技术的基础上,构建了全新的财务预警模型。本文的主要研究目的如下:(1)采用人工网络模型和数据挖掘技术来构建财务预警模型。(2)将财务指标和非财务指标相结合,从而提高财务预警模型的准确度。(3)比较传统的统计学方法(因子分析法)和人工智能方法的预测准确度(4)扩大模型的应用范围,使其能在财务预警体系中发挥良好的作用,既能为投资者提供信息也能为监管机构提供信息。本文实证研究所采用的数据来源于台湾证券交易所数据库。本文后续的内容安排如下:第二章是相关研究的文献综述,第三章介绍了本文采用的方法以及各个步骤的作用。第四章介绍了利用因子分析法选取合适的变量指标的过程。本文在第五章展开了多次实验,以证明方法的预测性能。在第六章,将利用本文的方法得到的结果分别与单独使用人工神经网络和数据挖掘技术方法所得到的结果进行比较。最后,对财务预警和未来的研究方向作出了总结。
2文献综述
2.1人工神经网络
人工神经网络是由多个相互连接且并行通信的非线性节点组成的。每两个节点间的连接权值是可以修改的,这使得人工神经网络不用对问题采取分析解决问题的方法就能从样本中直接学习。应用最广泛的几种学习类型如下:
监督学习:监督学习是当人工神经网络模型的输入层和输出层是已知的时所采用的学习模式。监督学习算法的任务是在经历过一系列训练样本的训练之后,能够根据任意一个确定的输入对象预测函数值。采用监督学习算法的人工神经网络模型被广泛应用于解决函数逼近和分类问题。
非监督学习:是一种以特征值的形式呈现给人工神经网络的模式,与监督学习不同的是非监督学习中不存在先验输出。采取非监督学习的人工神经网络模型被成功地运用于数据挖掘和分类工作中。自组织映射(SOM)和自适应共振理论(ART)是该类模型两大最常见的典范。
反向传播网络是一种使用监督学习方法和前馈结构的神经网络。反向传播网络是应用最广泛的用于分类和预测的神经网络之一(Wu, Yang, amp; Liang, 2006),它可以处理复杂和非线性的数据关系,被认为是一种先进的多元回归分析法(Jost,1993)。 它最早是由Werbos (1974)提出的,随后,在Ronald, Rumelhart, 和Hinton (1986).的研究中得到了进一步发展。Medsker 和Liebowitz (1994)在他们的研究中详细介绍了反向传播网络算法反向传播网络主要由输入层、隐藏层和输出层构成,其结构如图1所示(Panda, Chakraborty, amp; Pal, 2007):输入层是模型的激励,输出层是输入激励的结果,隐藏层决定了输入层和输出层之间的映射关系,而各个神经元之间的关系则被作为连接权值储存。输入的信号会被权重因子修改,权重因子反应了第一层第i个节点到第J个节点之间的相互关系。随后,对已修改的信号进行求和(总活化),再利用S形传递函数对和进行处理。类似的,由隐藏层输出的信号也会被输出层第K个节点与隐藏层第J个节点之间的权重因子处理。随后,对已处理的输入信息求和,传递函数F再对和进行进一步的处理。最后,处理的结果在输出层输出。
让Ip = (Ip1,Ip2, . . . , Ipl), p = 1,2,N代表N中输入模式中的第P中模式。Wji代表输出层第i个节点与隐藏层第j个节点之间的连接权值,Wkj代表隐藏层的第J个节点与输出层的第K个节点之间的连接权值(Pandaet al., 2007)。
输入层神经元的输出结果为:Opi=Ipi,i=1,2.....l (1)
隐藏层神经元的输出结果为:Opj = f(NETpj) = f() j=1,2....m (2)
输出层神经元的输出结果为:Opk = f(NETpk) = f() k=1,2..n (3)
其中,传递函数f为sigmoid函数,f(x) = 1/(1 e-x).
图1 反向传播神经网络结构图
反向传播神经网络被广泛应用于各个领域,比如调查长期预测(Lee, 2004),提高顾客满意度(Deng, Chen, amp; Pei, 2007),预测后刀面在演习中的磨损率,提高半导体制造工厂中作业完成时间的预测准确率,提高诊断病灶性的室性心律失常的精度(Yılmaz amp; Cunedioglu, 2007)。
综合上述文献可以发现,目前已有大量将BPN应用到不同领域的研究。然而,几乎没有学者将其运用于与财务预警相关的实证研究中。因此,本文运用反向传播网络研究破产预测领域中的潜在财务危机预测。希望本文的研究结果可以给投资者和监管机构提供一种有效的方法,使他们能够避免对一个即将破产的企业进行投资。
2.2数据挖掘
数据挖掘,也叫做数据库知识发现,是指在巨大的数据库中发现有意义的模式的处理过程(Han , Kamber, 2001)。此外,它能帮助企业做出正确的决策,提高企业竞争力(Huang, Chen, Lee, 2007).。数据挖掘是一种复杂的涉及多重迭代的探索性过程。数据挖掘的处理过程概略如图2所示(Han amp;,Kamber, 2001),该过程是互动性的和迭代性的,具体步骤如下:
第一步:应用域辨识。调查并理解应用领域和相关的知识。此外,从管理员或者用户的角度识别KDD的目标。
第二步:选择目标数据集。选择一个合适的数据集,也可以聚焦于已剔除与分析任务相关的数据的变量子集或数据样本。
第三步:数据预处理。数据挖掘的基本操作包括数据清理和数据约简,在数据清洗过程中,要剔除噪声数据并处理缺失值。在数据约简过程中,我们减少不必要的维度或者采用有效的转化方法。以上操作的主要目的是增加所选变量的有效值。
第四步:数据挖掘。这是一个至关重要的过程,这一过程需要运用人工智能的方法来搜寻以一种特定的代表性形式呈现出来的有意义的或所需的模式。例如,关联规则挖掘、分类树和聚类技术。
第五步:基于以上步骤,可以将所提取的模式或者基于所提取的模型得到的数据可视化。此外,这个步骤可以检查或者解决关于以前所相信的知识的任何冲突。
第六步:知识应用。在这一步,可直接将所得到的知识运用于当前应用域或其他将要采取进一步行动的领域。
第七步:知识评价。将数据基于不同衡量利益的角度,识别出最有利的代表知识的模式。此外,此步骤有助于提高所采掘的数据的准确性和有效性。
图2 数据挖掘流程图
一个特定的数据挖掘算法通常是一个模型优先搜索组件的实例化。当前数据挖掘过程的常见模型函数有以下几种(Mitra, Pal, amp; Mitra, 2002).
(1)分类:将数据项归为几种预定义类别中的一类。
(2)回归:将数据项映射到实值预测的变量上.
(3)集群:基于相似度和概率密度模型对数据进行自然分组,形成集群,并将数据项映射到集群。
(4)关联规则:描述不同属性之间的关联关系。
(5)综述:关于数据子集的紧凑描述
(6)依赖建模:描述变量之间的显著依赖性。
(7)序列分析:建立序列模式,比如时间序列分析。其目的是模拟序列产生的情况或者提取并报告偏差和长期趋势
近几年,有很多研究成果将数据挖掘技术应用于多种领域。在财务领域,数据挖掘技术也得到了成功的运用。近几年的例子如下:Huang, Hsu,和Wang (2007)采用时间序列挖掘方法模拟人工智能并研究财务数据库模式。Kirkos, Spathis, 和Manolopoulos (2007)采用分类挖掘法识别造假的财务报表。Chun and Park (2006)结合了回归分析和案例推理方法来预测股票市场指数。然而,很少有关于数据聚类方法的研究,关于财务预警及其相关话题的实证研究就更少了。因此,本文采用数据聚类方法以提高上市公司破产预测的准确度.
3研究方法
本文将人工神经网络和数据挖掘技术相结合来研究财务预警。研究方法如图3所示:第一阶段,我们对由来自于台湾证券交易所的初始数据构成的数据库进行处理,在随后的数据预处理过程会处理以上所有数据。之后,对数据集进行清理和预处理,剔除数据集中的差异和不一致,提高数据集质量。这一阶段的目的是选取合适的指标,包括财务指标和非财务指标,为后续的因子分析做准备。
完成上述步骤之后,下一步骤是加载上述指标和将要用于人工神经网络以及数据挖掘技术的预测规则集。关于“财务预警”的内容,会在下面的章节详细介绍。
在财务报表建模阶段,本文选取财务报表数据集用于人工神经网络和数据挖掘。在运用人工神经网络方法时,我们采用反向传播神经算法来挖掘规则并预测财务危机。在数据挖掘的过程中,本文采用聚类技术对财务危机进行识别并分类。随后,为了识别代表数据间关系的模式,运用算法对数据集进行分析。分别运用BPN算法和聚类算法来确定财务预测模式或规则。
在财务预警评价阶段,通过多次因子分析,比较BPN和聚类挖掘技术的预测准确度(无因次分析,第一因次分析,第二因次分析)
此后,本文建立了智能的财务预警模型,并用其验证来自台湾证券交易所的新的财务报表数据集。
4财务预警样本选择和指标体系构建
4.1数据
本文的样本包含来自台湾证券交易所的68家上市公司的数据。时间跨度为199年1月-2006年十月,共计7年零十个月。其中,34家公司为财务危机公司,另外34家是与其配比的健康。
如果公司的审计报告、财务数据库、税务数据库和证券交易所的数据中没有任何暗示或者证据说明公司有可能陷入财务困境,即认为该公司是健康公司。这当然不能保证公司财务报表没有造
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[150254],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
