作者:2017级本科生 陈永霖 电机系
于沛鑫 电机系
指导老师:林今 电机系
关键词:拓扑数据分析 相区识别 蒙特卡洛方法
摘要
在低压配电网中,居民用户一般为单相用户,可以由ABC三相中的任意一相供电。每个用户电表的相位信息是电表信息档案的重要组成部分。然而在多年的运营过程中,由于技术、管理等各方面原因,电网公司的台区电表相位信息错乱严重。
为了查清辖区内各电表的真实相位信息,电网公司一直采取的都是人工排查的方法,这样做能够保证准确率,但是成本巨大,费时费力。在学术界,目前已有的相位辨识算法普遍存在准确率的瓶颈,最高仅在90%附近。基于这一现状,本项目希望在保证一个电网公司可以接受的准确率(95%以上)的前提下,改进已有算法,降低人工排查所需的成本。
创新点
本项目主要有两个创新点:
1、针对中国电力系统的特点对算法进行改进,采取混台区辨识;
2、利用配电网的先验信息优化训练集选取策略,基于蒙特卡洛方法[1],按照数据集中不同台区、不同相位的分布选取训练集。
图2 混台区辨识
项目成果
本项目开发了一套基于大数据技术的配电网智能电表分相辨识算法。该算法以每个智能电表的电压幅值时间序列作为数据输入,利用待更新档案的相位分布信息来选取训练集,并通过现有的“随机森林[2]+TDA[3]”分类器[4],给出每个电表的预测相位标签。实验测试结果为:利用TDA + Monte Carlo(下图中的绿线),在10%的workload(即人工排查的工作量)下,得到了约97%的相位辨识准确率,与聚类方法相比,准确率提高了约5%。
图3 Comparison of different classifiers and models with the fraction of wrong labels set to 10%.
[1] 蒙特卡洛方法:也称统计模拟方法,是1940年代中期由于科学技术的发展和电子计算机的发明,而提出的一种以概率统计理论为指导的数值计算方法。是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。
[2] 随机森林:在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定.(来源:Wikipedia)
[3] 拓扑数据分析技术(TDA):是应用数学当中一种将拓扑学与数据分析相结合的新兴技术,主要用于数据挖掘和计算机视觉理论研究。
[4] N. Yu, “Phase identification in power distribution systems,” Patent, WIPO (PCT) App. PCT/US2017/045589. [Online]. Available: https://patents.google.com/patent/WO2018027180A1, Feb. 2018.