突变与趋势变化
原文作者 Andrew Pole John Wiley amp; Sons
摘要:与爆米花过程相比,突变过程更具有不可预测性。及时识别从发散到突然反转之间的变化和断点是成功利用突变过程的重要因素。而突变过程的完善能够为趋势变化做一个扎实的铺垫,集合Cuseore统计量可以更好地识别趋势变化。但在实际问题中,识别实时问题的趋势变化仍然有很大的难度,容易使得研究者无法识别突变过程的起点。因此最为妥善的做法是考虑突变过程的持续时间和突变移动的大小,结合各个方面的因素来决定突变的结束点。
关键词:突变过程; 趋势变化; Cuseore统计量
11.2突变预测
我们与针对爆米花过程的预测结果进行对比,发现突变过程无法准确地预测反转量的大小。将爆米花过程,应用到爆米花数据中,而突变的过程,则应用到突变数据中,根据变动的原因进行分类。捷径在哪儿呢?例如在2002年上半年,其图形像是一个爆米花过程,2004年下半年则属于突变过程,而中间的18个月,剧烈的变化造成破坏性的影响,因此对其很大一部分交易来说,两个过程所得到的统计均值为,交易结果是类似的。对于交易来说,这样观察的意义就是,假如在合理的一段时间中,两种过程所产生的交易数量是类似的,交易的总变动也是类似的,那么回报率的期望值也应该是类似的。当然,在实际问题中不能如此简单地处理。当突变过程对价差运动的特性进行描述比爆米花过程更准确一些,那么价差波动率的幅度也会显得比较低(见第9章)。在2003年之前,当时的平均波动率差不多是2004年下半年的两倍,爆米花过程对于价差行为的描述是比较准确的。在2004年下半年,当时的平均波动率大约是2003年的一半,突变过程是一个更准确的模型。这些都将对市场的理解加入到算法交易之后导致的结果,并不是巧合。(见第10章中的描述)。
表面上看来,总体方差变小导致模型预测也变小体现了回报减少与方差收缩两者之间的关系。但当移动持续的时间比较短,或者是比较高频率的移动时,面对的情形就改变了。在这种情况下.虽然个别交易的收益降低,增加交易的数量,回报也会增加。交易数量增加会造成的交易成本增加。向经纪商和使用文易算法所缴纳的费用,会逐渐下降,这是一个必然的结果。
在这里必须要回答的一个关键问题是,如何系统性地利用突变信号来进行交易,才能产生“值得的、具有经济价值的回报”?
在理想的状况下,人们想要在突变过程中出现突然的变化之前,识别它的开始点,并且在没有对市场产生冲击的情况下有充足的时间进行交易,并且很快就能识别出突变过程的结束,以便取得最大的利润。到目前为止,还没有一个很简单的识别方法,但是基于持续时间计量的近似方法已经建立起来了。
如图11-5所示,显示了突变原型的成长与下降(或者下倾和跳跃,如果你更喜欢反转)情形。将注意力放在突变移动的建立过程,我们就可以识别出一个跟持续时间有关的规则,这个规则可以在趋势产生之后的第k个周期,找出交易进场的信号。只要经历几个周期,就可以知道趋势已经开始了。在“突变”转向之前,通过统计分析,可以得到趋势持续时间的分布。因此可以将交易的进场信号,设定为这个分布的某个固定值。例如将固定值设为80% ,就可以得到一个不错的操作规则。
及时地识别从发散到突然反转之间的变化和断点,是成功利用突变过程的关键因素。与爆米花过程进行比较,在突变过程中交易进场的时机在统计上来说更为严格。突变反转的速度相对较快,太晚识别出突变交易时机所造成的损失,会远大于爆米花过程。在图11一5中的C点是峰值的最高点,在C点之前未能进场意味着错过了整个的机会。在图I1-3中,爆米花过程与之有很大的不同,太晚进场会降低交易的回报,但影响有限而已。要对突变过程进行模型化交易,必须要有更高的警觉性。
11. 3趋势变化的识别
在统计套利的发展中,有很多的文献讨论变化点的识别,有很多有趣的模型和许多令人着迷的方法。在这里我们的目的只是进行一些简单的比较,虽然如此,这仍然是一个具有挑战性的工作(如果对金融数据的模式识别不具有挑战性,那么我们也就不用辛苦地撰写和阅读文献)。在统计过程的控制领域中,Cuscare统计量是一个极为有效的方法(博克斯与卢西诺,1987)。
首先将突变过程添加到一个上升的数据序列之上。图11-6显示了一个基本的趋势,其斜率为1. 0,同时一个斜率为1. 3的突变移动,从时间10的地方开始出现。让我们来看看,在这个很容易理解的示例中,趋势变化的Cuscore统计量表现如何?为了识别出趋势中的变化,将Coscare统计量定义为:
其中是一系列的观测值.beta;是斜率(也就是观察的时间序列值在每个单位时间中的变化率。),而t是一个时间指数。Cuscore值形成的图形如图1l-6所示。尽管我们看过许多时间序列图形,当我们看到这个看起来不可思议的方法时,还是很吃惊。这种统计识别方法揭露和展示了斜率上的变化所呈现出来的证据。当斜率从初始值1.0增加30%变为1.3,其变化的幅度应该是很明显的。30%已经很接近1/3的程度,是一个很大的变化,应该引起我们的注意。但这个图形让我们有一个非常不同的感觉。如果我们在图11-6a中画上一条延长的虚线,我们很难在时间10的地方注意到已经出现了变化。这个图形从视觉上看起来是很协调的。在这样的图形中如果配有文字进行说明,那些文字可能更容易受到大家的关注。
Cuscore统计量将常数转化为指数函数,这样戏剧性的转变,有效地揭示了状态的改变。当观测值并没有落在指定的数学曲线上时,Cuscore统计量的表现如何呢?图11-7加人了随机的噪声(自由度为5的学生t分布,其尾部的分布会比正态分布厚一点),将其放到图II-6中所描述的序列之中。如果说之前斜率增加这样的变化,在视觉上已经很难识别,那么现在在视觉上更是不能识别。Cuscore统计量又表现如何呢?
在图11-7中,Cuscore统计量的图形比之前的更加戏剧化。对此,我们更是兴奋。通常很少用眼睛进行分析,因为很容易产生疲劳。在时间15之前,Cuscore统计量出现了趋势增强的信号,而且在一或两个周期之后,也确实发生了。
11. 3. 1利用Cuscore统计量识别突变过程
在最前面的例子中,趋势采用的是常数,Cuseore统计量的系数beta;为1.0。不幸的是,我们都很难量化金融序列的变化率,必须使用原始的观测值。如果想在一个价差序列中,识别出其中的突变移动,需在突变过程发生之前,得到一个相应趋势值。我们最先想到的可能是,利用第3章中所建议的指数加权移动平均(EWMA),来计算局部的平均值。但这个想法显然存在“先有鸡,还是先有蛋”这一问题。不管是采用EWMA还是其他的公式计算出的局部平均值,在突变过程一开始出现时,掺杂到局部平均值的计算之中。如果计算斜率时,所采用的数据只包含突变过程发生之后的数据,而没有包括突变过程之前的数据,Cuscore统计量不可能识别出斜率的变化。我们所需要的是,在变化发生之前得到一个趋势的估计值,如果出现变化的情况,这个估计值也能产生相应的变化。由于变化发生的时间点是未知的,在这种情况下,我们能做些什么?
下面介绍的两个简单策略对此会有一些作用。第一个策略是,在突变过程确实存在的前提下,估计当前的趋势,我们可以利用一段比较长的时间周期中(例如将一般突变过程所持续的时间乘上几倍)的价差交易数据,观察其突变过程所呈现出来的经验分布。第二个策略是,采用一个斜率作为当前趋势的枯计值,这个估计值可以用EWMA来计算。对于研究的序列来说,这个估计值是一个比较合理的值。修改后的Cuscore统计量公式可以表示为:
其中的是当前斜率的估计值。在附录11A中,我们给出了一些关于的来历,对于识别股价趋势变化的Cuscore统计量进行仔细地审查。
操作上来说,Cusuore统计量运作得很好,但如果还想要更早地识别出突变过程,应该还有其他更好的识别程序。其中一种可能的方法(在附录11A中有介绍)是采用一个延时局部趋势枯计值,可以避免“先有鸡,还是先有蛋”这样的问题。因为我们“已经知道”突变过程开始之后,可以在5个单位时间之内,把它识别出来,所以可以在估计相应的趋势时,先去掉至少5个最近的序列观测值。这样做或许是合理的。
为什么不取5个以上的观测值,用于延迟计算EWMA值,以达到“安全”的状态?(就技术上而言,当突变过程以“温和的”方式出现,即便在有噪声的情况下.也可以提交识别突变移动的概率)。这个问题与模型设计者的设计艺术和识别者的执行效率是密切相关的。当你从事于这项研究时,需要考虑如下几项重要的事情:
一般的趋势与发生突变过程之前的趋势之间的差异,呈现什么样的分布?
突变过程反转的幅度,呈现什么样的分布?
突变过程趋势累积的持续时间和突变反转的大小之间有什么样的关系?一般的趋势与发生突变过程之前的趋势之间差异的大小,和突变反转的大小之间有什么样的关系?
想要捕获具有经济价值的突变过程,应该具备有怎么样的条件?
如果错误地识别突变过程,会造成多大的损失?
祝大家能顺利捕获突变过程!
11. 3. 2突变结束了吗?
如果价差序列返回到(局部的)均值,只要超过均值一点点(考虑到随机共振的作用),爆米花过程就算是结束了。什么时候突变过程才算结束呢?这个问题目前最稳当的答案是:如果在突变过程发展的相反方向识别到峰值,那么出现峰值的时点往后取一段固定的时间作为突变过程的结束。如果突变过程的发展是增强原来的趋势(如同之前的示例),那么这个突变过程结束的时点,就应该是突然下降的时点。
在前面的统计套利模型化过程中,我们并没有一个成功的方法来解决这个问题。如果突变过程仅仅是一次性的大型波动,或者是跨越好几段期间的趋势变化,应用Cuscore统计量进行监视,那么只要它一出现就能识别。如果采用前面第二个修改过的Cuscore统计量,来识别移动的特性,我们所监视的区间,是从估计的突变过程起始点开始,到最后一个观察值之前的一或两个周期为止。通过Cuscore。统计量,我们可以寻找出突变过程一开始的发展,但如果遇到相反方向的突然的变化,则会延迟一段时间才能辨识出来。如果我们将最后面的那些观测值包含进来,就会出现前面所描述过的状况,Cuscore统计量无法识别出突变过程的起点。
因此到目前为止,如果想要为交易制定一个退出的规则,最好方式就是考虑突变过程的持续时间与突变移动的大小,然后将各方面的情况结合起来,决定突变的结束点。这种做法有个很重大的危险是如果等待的时间太久,又出现了另一个突变过程,就会损失第一个突变过程所获得的利润。在模型与交易规则的调整方面,还有很多可改善的空间。
外文文献出处:.Andrew Pole, Statistical Arbitrage,2007, : 198-205.
剩余内容已隐藏,支付完成后下载完整资料


英语原文共 256 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[287138],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
