时空数据预测与识别技术
01. 成果简介 随着移动计算、传感器网络和科学观测设备等新技术在经济社会各领域的广泛应用,特别是监控、遥感、定位等技术的崛起,人们获得了海量的时空数据。时空数据分布于连续空间,并且随着时间动态变化,具有十分复杂的模式规律。例如,卫星遥感数据和雷达回波数据是广泛应用于气象观测和军事侦察的时空数据,在连续的卫星扫描或雷达观测过程中,形成时间轴上的一系列遥感图像或回波影像,反映三维地理空间中某种观测物理量的变化规律。视频监控、医学影像、气象预报、环境监测等很多应用领域都涉及时空数据预测和识别任务,在问题求解过程中需要同时考察时间和空间两方面因素,存在时间上的非平稳性和空间上的高维相关性两大技术难题。 本成果创新大数据深度学习技术,从复杂、海量、高维、非平稳的时空数据中识别重要的时空模式,挖掘在时间和空间上的变化规律,并对未来的时空演变趋势进行预测,形成了时空数据预测和识别的深度学习技术(如图1所示)。具体包括:· 提出卷积结构与循环结构深度融合的统一建模方法,学习高维度、非线性时空特征表示,挖掘空间关联结构与时间动态信息;· 提出时空记忆单元和回忆机制,对时空非线性、非平稳性变化进行预测学习;· 提出时空数据的迁移学习技术,降低时空分布差异,实现知识的跨时空迁移。 该技术尤其擅长捕捉高维度、非平稳时空数据的非线性变化规律,例如多物体对象在空间和时间上的“产生、消亡、运动、形变“等复杂时空数据场景。与同类技术相比,运行时间短,预测和识别精度高,在国际上处于整体先进、部分领先的水平。 图1. 用于时空数据预测和识别的循环神经网络架构及其时空记忆单元图2. 本成果技术(时空数据预测与识别)在北京交通流量预测任务上的效果02. 应用前景 该技术成熟度高,部分成果已经以线上系统的形态成功应用于中国气象部门强对流天气预报业务中,与国内现有极端天气预报业务系统相比,该技术将雷达回波外推预报准确率平均提高了45%,其中高强度雷达回波外推预报准确率提高了353%,处于国际先进水平。气象灾害中70%以上是由雷暴大风、下击暴流等强对流天气导致,致死人数占自然灾害死亡人数的93%,因此该技术在避免人员伤亡、实现财产保全、减少农业损失方面产生显著的社会经济效益。同时,该技术还可广泛应用于时空数据的预测和识别场景,在关系国计民生的气象、环保、交通等领域可以发挥重要作用,应用前景广阔。例如,采用该技术可实现未来交通流量时空分布的精准预测(如图2)。该项成果还入选了2018年首届数字中国建设峰会,为杭州G20峰会、厦门金砖会晤、中国国际进口博览会等提供了精准预报支持,获得2018年教育部技术发明一等奖和2018年中国气象学会科技进步奖一等奖。03. 知识产权 本项成果已获得发明专利授权6项。04. 团队介绍 本成果团队长期研究大数据管理与分析技术,包括分布式数据存储与查询、深度学习与迁移学习、业务过程挖掘、数据质量治理等方向。团队负责人为王建民教授、软件学院院长,机器学习小组组长为龙明盛副教授。团队在本领域发表国际学术论文100余篇,申请专利100余项,授权专利60余项。相关成果获2018年教育部技术发明一等奖、2018年中国气象学会科技进步一等奖、2014年国家科技进步二等奖、2013年中国电子学会科技进步一等奖、2012年教育部科技进步一等奖等奖励。05. 合作方式 技术许可 / 软件服务。
清华大学
2021-04-13