对水需求过滤系统测量不良数据分布评估外文翻译资料

 2022-10-30 11:10

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


对水需求过滤系统测量不良数据分布评估

Doosun Kang1 and Kevin Lansey, A.M.ASCE2

摘要:水需求估算已经通过使用加权最小二乘法WLS计算。 水需求估算掺入实地测量与系统仿真模型。 WLS估计器对由监控和数据采集故障引起的杂散测量敏感。 使用污染测量的估计值不可靠,在需求之前应过滤不良数据。本研究提出了一系列统计方法,它通过识别其位置和校正数据值来用于检测不良数据。提出的方法是基于线性测量模型,线性关联状态变量,节点需求, 到现场测量管流量, 使用合成产生的数据的简单的假设网络。其应用表明,该方法可以成功地作用于对可靠数据的需求估计,以及单个和多个非相互作用坏数据的预处理。

数字对象唯一标识符:10.1061/ASCEWR.1943-5452.0000051

CE数据库主题标题:数据分析; 配水系统; 水需求。

关键词:坏数据的过滤; 需求估计; 假设检验 SCADA系统; 水分配。

介绍

配水系统WDS 的操作和评估是基于国家确定的需求估计,它是通过使用监控和数据采集收集的一组现场测量的估计器和SCADA系统。所以呢,状态估计器提供准确可靠的结果至关重要。在估计模型的正确假设下,现场测量是需求估计的关键要素。SCADA现场测量不仅包含高斯噪声,也有由于系统造成严重的误差故障和/或电表故障引起的其他噪音。 这些敏感错误的测量和基于此的估计测量对于系统操作是不可靠的。

康和兰西(2009) 说明了一个节点的需求可以使用管道流量测量实时估计WDS。 根据估计需求,节点压力和流量可以使用模拟来预测氯浓度模型。 康和兰20010将本研究扩展到找到最大化状态精度和准确度的最佳场测量位置估计 。但是,在这两个研究中,现场测量中的误差被假定为高斯和差,没有考虑到数据的错误。系统故障和仪表故障是随机现象很难辨认。早期状态/参数估计是研究调整权重因子的最小二乘估计方法。(Powell et al。 1988; Datta和Sridharan1994; Reddy等人1996年)也就是说,分配更大的权重能更精确的测量数据,错误的数据与严重的其他错误是通过减少相关的重量来抑制或消除那些测量。 Powel(1988年)用一个迭代重新加权的最小二乘法算法中的倒数测量方差用作估计的初始权重。如果估计的残差,即观察到的差异估计测量大于给定的限制,重量被修订,并与估计的残差成反比。因此,大于指定极限的任何残差都表示可能存在不良数据,并重复重新加权序列直到达到收敛。 Reddy等人(1996年)因此提出了两步迭代重新加权方案,其中归一化残差用于在每个迭代步骤中修改权重。通过研究表明,迭代重新加权的方法在状态/参数估计和处理噪声数据方面都是成功的。即使包括不好的测量。但是,选择的区分总误差与高斯噪声的剩余极限是模糊和主观的。不好的测量通常不提供任何信息状态/参数估计,并会导致解决方案中的分配权重产生偏倚。 因此,可能会需要彻底清除测量集中的坏数据。 然而,WDS内的仪表冗余度通常太低,消除不良数据可能使问题无法解决或该系统不可观察。 这些问题可以通过纠正可疑的坏数据来消除,即使他们进入状态估算过程。

本研究为不良数据提供了一系列统计方法过滤,即检测,识别和纠正错误测量。 该方案在需求估计之前应用,以消除错误数据对需求的影响估计。 所提出的方法应用于假设使用合成生成的数据集的简单网络,如无差错数据,高斯噪声数据,消防流数据和噪声数据包含一个或多个受污染的测量。

方法

当需求估计模型未能合理提供时准确的估计值时必须得出结论,测量的现场数据包含虚假错误或估计模型不足以应付解释关系,或者两者都有。这里假定模型是正确的,只有测量的情况被严重错误所污染。呈现方法基于这样的假设:场测量和状态变量之间的关系是线性的或接近线性;因此可以用线性测量来解释模型。

程序是由Monticelli(2000)提出的对于线性电力系统模型。用系统模型和一套场数据,应用两个假设检验来检测存在的SCADA系统的杂散测量。如果通过不好的数据根据检测到的错误数据的位置被识别测量残差估计。那么可疑的坏数据则通过强制他们的残差为零调整。每个细节流程步骤总结如下。

测量模型

液压方程组可以写成

z = h(x) e (1a)

其中h(x)=定义保护的非线性方程组在管网中的质量和能量; x =状态的n向量

变量(节点需求 ),z =场测量的m向量(管流) 和e =随机测量误差的m向量。 在不存在严重错误,假设e向量的元素是正常和独立的,每个都有零平均值。该相应的测量误差协方差矩阵用以表示[Rz,其中i = 1,...,m的元素为i2。 注意n是未知状态变量的数量,m是测量的数量,mge;n。

如康和兰西(2009)所示,非线性系统描述WDS中的流动的守恒方程可以通过线性模型迭代近似。因此,假设a线性测量模型可以应用于近似液压系统并遵循一种形式

z = Hx e (1b)

其中H =雅可比矩阵(m乘以n矩阵)采取系统的平均需求水平。在典型的一天,这个矩阵可以随着时间的推移调整到平均期限。对于线性模型,估计值xx的状态矢量(x)可以通过最小化加权最小二乘法来计算错误或

J(x^) =(z - H x^)R z - 1 (z - H x ^)= (2)

最优解x是当J(x^)等于零并产生

-z (3)

其中。

估计(z^)的测量矢量(z)被表示为z = Hx,剩余估计矢量r r被定义为

r = z-z = z-Hx (4)

应该注意的是,雅可比矩阵H是先验的平均需求水平和测量误差协方差,Rz,由仪表精度给出。因此,矢量需求估计,剩余估计值可以从等式(3)和(4)计算,在详细需求估算之前使用那些给定的信息。

检测坏数据

要确定测量数据集是否包含不良数据,二种假设检验方案,J(x^)测试和和测试都被应用。该前者是基于卡方分布,后者基于标准正态分布。

J(x^)测试

如果(i=1,...,l)是标准正态随机变量,y是一个随机变量,其随机平均分布为l个自由度,平均值为l和方差2l。假设测量误差ei是正态分布和独立的,其中每一个具有零平均值和等于Delta;i2的方差,那么在J(x^)等式(2)遵循一个卡方分布与m-n自由度。零假设对于该测试,没有检测到不良数据,或者E(J(x^)) = m-n,其中E是期望运算符。如果这个假设被拒绝.J(x^)大于限制值,从具有m-n自由度的卡方分布确定为具有累积概率1-alpha;的值的Delta;m2 -n,1-alpha;。

测试

如上所述,假设测量误差ei是正常的和独立。由于相应的剩余估计值r i= zi-z i由测量的线性组合来定义错误,它们也通常以平均值等于零分和方差等于Pi;ii 2,其中ⅱ2被定义为对角线剩余估计R的协方差矩阵的元素r其中Rr定义为

[Rr = Rz-Rz = Rz-HG-1H =Sigma;I-HG-1Hle;Rz-1le;Rz= SRz (5)

其中Rz = HG-1H S = I-HG-1Hle;Rz-1。然后可以定义归一化残差rinisin;i= 1,...,m作为残差估计值r i与标准差的比值剩余估算值divide;ii

rn =(diag(Rr )) - 1 / 2r^ (6)

其中diag(Rr)=包含协方差矩阵R的对角元素的对角矩阵r。归一化残差为然后通常以零均值和单位方差分布,N ( 0,1).该测试的零假设是没有检测到不良数据

或E(ri n)= 0。如果max ( ri n )ge; Z1-alpha;/ 2,这个假设被拒绝,其中Z1-alpha;/ 2是对应于的标准正态偏差累积概率为1-alpha;/ 2.

识别不良数据

上述统计测试确定是否包含不良数据在可用的测量中。下一步是识别信息是否为虚假的。考虑一下除了测量zi之外所有的情况,测量是由故障或误报表读取。如果zimeas = zitrue Balpha;i,其中B是测量的总误差的大小标准差的数量alpha;i,线性测量模型可以写成

z = Hxtrue Balpha;iui (7)

其中ui =空向量,除了具有值的第i个元素的1。残差估计的向量用等式(3) - (5)

r = z-Hx = Sz = Rr Rz -1z (8)

由于假设其他测量是完美的,即,残差为零,这就产生了

r = Rr Rz -1(Balpha;Iui) = B i-1Rr ui (9)

其中Rr ui =矩阵Rr的第i列。方程组定义的归一化残差矢量(6)被重写为

rn =(diag(Rr )) - 1 / 2r = Balpha;i-1(diag(Rr ))-1 / 2Rr ui = Balpha;i-1 (10)归一化残差与向量的第i个元素的比率(与测量错误相关的归一化残差)是

给予 (11)

其中yji =相关系数应小于1或

(12) 意味着不良数据与最大数据相关联归一化残差。其他测量可能有相同的但它们都不具有归一化残差大于坏数据,即第i次测量。因此,坏的数据立即被识别为具有最大归一化残差的测量。

纠正坏数据

鉴于大多数WDS应用中的数据很少,困难重重.如果测量数据不正确,可能会导致系统丢弃数据。因此,建议更正错误数据的方案。如果识别出不良测量zi,则校正项ci可以添加到可疑的测量中,导致新的测量矢量

znew = z ciui (13)

其中ui =空向量,除了具有值的第i个元素的1。从等式(8),新的残差估计向量是

r new = S(z ciui) (14)

为了避免引入偏差,在添加校正项ci之后,新的残差估计向量的第i个元素应为零i或

0 = Si (z ciui ) = ri ciSii (15)

其中Si =第i行向量和Sii =Sigma;i,i是第s个元素的矩阵S.由于ri和sii是已知的,因此可以估计校正项ci如

ci = - RI/SII (16)

通过将估计的修正增加到可疑度量,获得新的校正测量值,而所有其他测量值都不改变

修正

= zi坏 ci (17)

应用

所提出的方案应用于九节点假设网络(1), 九个节点中有七个节点有不明确的要求。并且具有类似消费者类型的节点被分组(标记数字)。分组将未知数减少到三组要求(n = 3的)测量管道流量被认为是被采取五个位置(m = 5)。只有管道流量是用作现场测量。调查提出的能力用于评估不良数据的方案,使用液压仿真模型合成生成管道流量数据集。首先是真的使用已知的基本需求生成流数据。嘈杂的流然后通过向真实流量添加测量误差来获得

数据。测量误差是N 0,其中alpha;= 0.1 /3.27对应于测量的10%的误差。消防流量数据是通过增加消防需求来产生的(150 l / s)到节点9,并再次产生通过添加测量误差而损坏的液压模型中的流量数据。通过添加严重错误来模拟仪表故障

嘈杂的流量数据。对于具有单个不良数据值的分析,管道8的噪声流量增加了50 l / s的误差多次不良数据分析,第二个误差为100 l / s被添加到管道1的流量。表1列出了使用的管道流量数据集对于每个模拟情况。

单一坏数据分析

对每个流程进行了两个假设检验,数据集和测试结果总结在表2中。95%的置信限度临界值为J(x^)测

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[138231],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。