|
清华大学
  • 252 高校采购信息
  • 629 科技成果项目
  • 10 创新创业项目
  • 0 高校项目需求

基于社区结构的快速子图匹配方法

2022-12-05 10:14:36
云上高博会 https://heec.cahe.edu.cn
点击收藏
所属领域:
新一代信息技术
项目成果/简介:

1.痛点问题

随着图在各领域的广泛应用,对图上相关高效查询方法的需求也与日俱增,特别是在社交网络、金融、电商、安全和航天等众多领域具有重要作用的子图匹配查询。

然而,现有子图匹配方法在实际使用中速度均较慢,当数据量较大时,现有方法的时间开销巨大,难以满足具体匹配过程中的时效性需求。同时,这些方法没有充分利用图数据的本质结构特点进行剪枝,在运行效率上仍有较大的改进空间。

2.解决方案

本技术提出一种基于社区结构的子图匹配方法,基于社区结构在匹配过程中进行剪枝从而加快子图匹配的速度。流程图如图1所示。

图1 本技术子图匹配计算流程

首先,本技术识别数据图中的社区结构,将数据图划分为若干“内部紧密关联、相互之间连接松散”的社区。接着,基于社区结构,提出三种优化策略对子图匹配过程进行优化,并实现了相关技术。

具体地,这三种优化策略包括两阶段破对称策略、基于社区路径的剪枝策略和基于社区结构的边界剪枝策略。其中,两阶段破对称策略利用模式图中的自同构映射,根据已得到的若干匹配结果推断出新的匹配结果,从而减少匹配过程中的计算量;基于社区路径的剪枝策略根据数据图中的跨社区的路径构建索引,在匹配过程中提前发现无法产生匹配结果的匹配尝试,减少匹配开销;基于社区结构的边界剪枝则考虑各社区的边界节点,即那些和其他社区的节点间有边关联的节点,根据边界节点的邻居情况进行剪枝,减小搜索空间,加快子图匹配速度。

基于上述优化策略,本技术提出的基于社区结构的高效子图匹配方法能根据给出的数据图和模式图快速返回子图匹配结果。该技术可以作为模块嵌入金融、电商和航天等已有软件系统,也可作为单独软件工具并支持二次开发。

3.合作需求

1)应用场景:在图数据中快速查找满足某种特定结构的子图结构,进而作为查询结果返回或用于后续深入分析。可用于包括但不限于社交网络、金融、电商、安全和航天等众多场景中。

2)资源对接:对图查询、图分析有需求且对其高效性有要求的个人、单位和企业等。

应用范围:

随着大量真实数据被建模成图(如社交网络、交通网络等),图数据库及相关技术的热度逐渐提升,对于图的高效查询与分析技术的需求也与日俱增。

本成果的目标客户包括图数据库、知识图谱的使用者,对图查询、图分析有需求且对其高效性有要求的个人、单位和企业等。本成果已在金融等领域有相应应用,具有一定的成熟度。

项目阶段:

作为图上基本且常用的查询,子图匹配在图查询和图分析领域均有广泛使用,且目前的子图匹配方法的速度均较慢,难以满足实际应用中的时效性要求,因此对于高效的子图匹配技术的需求相当迫切。

本发明计划在图数据等非结构化数据管理技术领域进行进一步拓展,未来通过技术许可等方式在更广泛领域进行具体应用。

效益分析:

已有主流子图匹配方法主要包括TurboISO、VF3和DAF。使用这些方法在包含五万左右节点的图上对五万全图进行子图匹配时,用时均超过100秒。本技术能在10秒内找到所有匹配结果,在性能方面具有明显优势。围绕本技术已进行了相关知识产权布局。

会员登录可查看 合作方式、专利情况及联系方式

扫码关注,查看更多科技成果

取消