云上高博会

基于大数据的能源互联网能量管理系统

随着电网数据规模越来越大，所蕴含的价值也越来越多。清华大学信研院研发了基于机器学习方法的能源互联网能量管理系统，主要功能为对电网的稳定性进行预测和可视化。系统分为训练部分和预测部分。训练部分通过历史数据进行机器学习，建立一个电压稳定性的分类器。分类器训练完成后，再对新增的未知数据进行预测。训练部分主要分为特征提取、类别标记、特征压缩、分类器类型选择。预测部分主要分为分类器数据启动阶段和预测输出阶段。本系统提出利用机器学习方法对电网电压稳定性进行预测，进一步综合多个节点给出电网态势感知的评估结果。在训练每一个节点分类器的时候，本系统将特征选取的时段和预测时间节点拉开，形成一种延时的预测方法，本发明对复杂系统有着更好的还原效果。2 应用说明本系统实施电压稳定性预测的具体步骤为:步骤 1:通过部署在关键测点的同步相角测量单元 PMU 采集电网实时数据，所述实时数据包含电网中每个关键测点的电压 U、有功 P、无功 Q、电流 I;分别计算 U 的衍生量 dU/dt，Q 的衍生量 dQ/dt，电压的变化量比上无功的变化量的衍生量 dU/dQ，用这些衍生量作为特征，来表征量的时间变化速率;步骤 2:对步骤 1 中提取的特征进行数据降维与压缩;根据特定时刻电压 U 是否恢复到标准值的 0.8 倍来区分每组样本组是否稳定，用 0 标记稳定，用 1 标记不稳定;步骤 3:选择分类器，建立一个电压稳定性的分类器;步骤 4:训练分类器;当分类器训练完成后，将训练好的参数储存起来;步骤 5:进入预测部分的数据启动阶段，填充特征矩阵，没有输出;步骤 6:把多个节点的特征按照顺序排列，形成特征矩阵;特征矩阵填充完成后，根据分类器给出的预测结果;特征时段向前滑动，最初的特征被抛弃，新特征补充在队尾，分类器持续给出预测结果;步骤 7:每隔一定时间间隔，要把新收集来的数据与以前的数据一起，重新回到步骤 4 训练分类器，更新参数。在具体系统搭建过程中，我们充分利用现有机器学习平台。其中 Hadoop 的文件管理系统 HDFS 负责数据存储;Spark 负责模型训练;Storm 负责在线预测;Kafka 负责在 Storm 和Hadoop 之间传递更新后的模型参数。

清华大学 2021-04-11