买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于图嵌入距离预测的子图匹配算法的图数据库查询方法_星环信息科技(上海)股份有限公司;复旦大学_202410025426.6 

申请/专利权人:星环信息科技(上海)股份有限公司;复旦大学

申请日:2024-01-08

公开(公告)日:2024-04-26

公开(公告)号:CN117932122A

主分类号:G06F16/903

分类号:G06F16/903;G06F16/901;G06F18/22

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.14#实质审查的生效;2024.04.26#公开

摘要:本发明属于图数据处理技术领域,具体为一种基于图嵌入距离预测的子图匹配算法的图数据库查询方法;基于图嵌入将数据图结构信息编码成向量,并将这一过程放在离线阶段,不影响在线查询阶段的响应效率;通过图向量的运算预测距离并基于距离预测的结果对候选集进行剪枝,具有向量运算计算量较小、硬件实现效率高的优点,同时可以获得基于高阶信息的剪枝结果。对比现有技术每次查询都会产生与查询图和数据图边数的乘积成正比的在线计算量,本方案具有在线响应时间上的优势。

主权项:1.一种基于图嵌入距离预测的子图匹配算法的图数据库查询方法,其特征在于,包括以下步骤:步骤一、离线阶段-预处理在数据图上使用图神经网络模型训练图结点的嵌入向量,将图的结构信息以向量形式编码;在数据图上采样,获取结点对和结点之间的距离;将结点对的嵌入向量和结点间距离作为模型输入,训练距离预测模型;再将起始结点和目的结点的嵌入向量作为训练好的距离预测模型输入,输出这两个结点之间的距离预测结果;步骤二、在线阶段-子图匹配1生成候选集首先,用户输入一个查询图,对于查询图上的所有结点,首先使用标签和度数过滤器LDF初步生成查询图结点的候选集,即数据图中标签与查询图结点相同,且度数不小于查询图结点的结点构成的集合;然后,建立查询图结点的索引,索引保存了与查询图结点距离为特定值的所有结点信息;索引结构包括:结点ID、距离、数量和具体点信息,其中,结点ID字段的值是图中唯一标识当前索引结点的ID,距离字段的值是从当前索引结点出发经过的距离,数量字段的值是从当前索引结点出发经过相应的距离到达的候选集结点个数,具体点信息字段保存相应到达的结点的ID;接着,基于距离预测对进入候选集的数据图结点建立索引,并在建立索引的过程中与查询图相应结点的索引结构进行对比,将对比结果不满足条件的结点移出候选集,以实现对候选集的剪枝;其中:数据图结点的索引复用查询图节点的索引结构,区别在于距离列对应的是距离预测的结果;2生成枚举顺序生成候选集的过程结束后,选择具有最小的候选集结点个数度数的比值的查询图结点作为枚举的起点,基于广度优先搜索顺序,依次选择具有最小的该比值的结点作为下一个枚举结点,直至查询图的所有结点被枚举,生成特定的枚举顺序,以用于后续的枚举过程;3枚举枚举阶段即基于结点的候选集,按照生成的枚举顺序,依次将候选集中的数据图结点对应到相应的查询图结点,并检查结点间的边是否满足查询图的要求;若枚举顺序中的最后一个结点通过检查,则获得了一个子图匹配结果,将该结果加入查询结果的集合;若枚举过程中有结点未能通过检查,则需要回溯到枚举顺序的上一步,继续枚举候选集中的其他结点;4获得数据图中查询到的与查询图同构的子图根据上一步的枚举结果,获取与查询图同构的子图。

全文数据:

权利要求:

百度查询: 星环信息科技(上海)股份有限公司;复旦大学 基于图嵌入距离预测的子图匹配算法的图数据库查询方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。