智能电表数据分析是指运用统计分析方法对收集来的大量原始智能电表量测数据进行处理、建模和计算,提取有用信息并形成结论,挖掘其内在关联和深层价值,为电力公司的商业运营、电网规划和运行维护等提供决策支持,使其更具有洞察力的过程与科学。与智能电表数据相关的数学统计分析方法可以归结为以下主要4类:相关(correlation)分析、聚类(cluster)分析、异常(exception)分析以及趋势分析。 1)相关分析。相关分析是研究现象之间是否存在某种关联关系的一种统计方法。相关分析分为线性相关分析和偏相关分析等,在智能电表数据分析中,线性相关分析最为常用,它研究两个变量间线性关系的程度,用相关系数R来描述。可以利用负荷与温度的相关关系,结合天气情况来预测负荷高峰。也可以利用连接在同一配电变压器二次侧的智能电表电压测量值来对某一组电表的相关性进行分析。 2)聚类分析。聚类分析就是以一定的标准来汇集某一类数据。例如,连接同一个变压器的电表可以通过聚类分析来确定变压器的负荷。虚拟电表是人为定义的聚类,能够聚类具有同一属性的电表的数据,一种典型的虚拟电表是聚类具有线性关系的电表来进行区域规划和分析(如某一馈线或变压器的负荷)。 3)异常分析。异常分析是指对偏离一般规律的异常事件或现象进行原因追溯的分析方法。异常分析在设备故障和用电异常(如窃电)诊断等方面能发挥重大作用。如统计变压器故障前的一系列历史异常数据,对其进行抽样和建模,就可以预测变压器的故障,从而及时检修或更换。 4)趋势分析。趋势分析是将两期或多期连续的同一指标进行对比,得出它们的增减变动方向、数额和幅度,以揭示事物变化趋势和变化规律的一种分析方法。趋势分析是智能电表数据分析的常用方法,最简单直接的分析就是利用多条趋势曲线同时展示某一用户用电量的同比或环比数据。设备故障前的趋势模型也能够用于辨别零件的毁坏或操作故障。 智能电表数据是配电系统某一时刻运行状态的真实反映,它必然满足或是符合电气工程基本原理和内在规律,如从电源向负荷方向,配电馈线的电压分布呈下降趋势;同一电源点下的各测量点的电压值相近且波动率相似;某一区域供入供出的电量必然守恒等等。基于电气工程的基本原理,采用智能电表量测数据为主要输入,结合上述数学统计分析方法,以信息技术为实现手段,求解某一配电系统特定问题的过程,称为智能电表数据分析法或数据分析元(smart meter data analytics),它是基于多学科的综合分析方法,为我们系统地求解某一问题提供理论指导,目前已成为电力公司数据分析的热点。美国电力科学研究院的T.A.Short,基于同一配电变压器二次侧的用户智能电表电压测量值具有强烈相关性的电气原理,采用线性回归的数学方法,以智能电表的电压值和电量值作为样本数据,实现了对变压器相位的识别,以及变压器与智能电表的电气连接关系和阻抗模型的自动创建。加拿大BC Hydro公司通过类似的原理,利用相关分析,对配电网GIS的拓扑正确性进行校验。该方法的优势是不需要现场人工排查或是额外安装测量装置,只需利用电表数据进行分析就能得出准确的结论。从以上研究成果看出,智能电表数据分析元在实际的工程应用中已经取得了非常明显的效果。 在智能电表数据分析的实际应用中,我们通常需要从超大规模的数据集中提取、处理和运算数据,因此大数据处理是智能电表数据分析过程中需要解决的重大问题。以加拿大BC Hydro公司为例,一个普通居民用户的智能电表,每天会产生3KB以上的数据,每月是100KB左右。当安装智能电表数目达到160万时,计量数据库里每天增加11GB的数据。我国由于人口众多、地域辽阔,主要省份的电力用户数量都在千万以上,其数据规模可以想象将会更加巨大。 在此情景下,显然单机或通常意义上集群系统已无法在指定的时间内完成在对智能电表数据的运算,应用并行计算模式已成为必然。并行计算(parallel computing)是指同时使用多个计算资源解决计算问题的过程,它的基本思想是用多个处理器来协同求解同一问题,即将被求解的问题分解成若干个部分,各部分均由一个独立的处理机来并行计算。并行计算系统既可以是专门设计的、含有多个处理器的超级计算机,也可以是以某种方式互联的若干台独立计算机构成的集群。目前开源的并行计算机集群系统主要有Hadoop、Spark等,这些系统已经被广泛使用在互联网和电信等领域,相信在智能电表数据分析方面也会得到良好应用。 |
电工学习网 ( )
GMT+8, 2021-12-6 20:42