买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】知识图谱链接错误的查修方法、装置及存储介质_平安科技(深圳)有限公司_201910842958.8 

申请/专利权人:平安科技(深圳)有限公司

申请日:2019-09-06

公开(公告)日:2023-08-01

公开(公告)号:CN110704634B

主分类号:G06F16/36

分类号:G06F16/36;G06F16/35;G06F18/214;G06F18/22;G06F18/30;G06N3/042;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2023.08.01#授权;2020.10.23#实质审查的生效;2020.01.17#公开

摘要:本发明涉及知识图谱技术领域,提出一种知识图谱链接错误的查修方法、装置及存储介质,其中的方法应用于电子装置,包括:定义知识图谱,并基于所述知识图谱构造训练数据集;基于所述训练数据集训练形成检测模型;将待检测的知识图谱输入所述检测模型进行错误检测,获取与所述待检测的知识图谱对应的错误链接;对所述错误链接进行修正,并提供与所述错误连接对应的潜在的实体间的匹配关系。本发明通过将知识图谱链接和实体类型相结合,构造局部关系分类器,从而检测图谱链接是否错误的方法,并对检测出的错误进行修正,能够自动识别和检测大型知识图谱中的链接关系,挖掘潜在的实体匹配关系,修正错误的链接,提升知识图谱整体的数据质量。

主权项:1.一种知识图谱链接错误的查修方法,应用于电子装置,其特征在于,所述方法包括:定义知识图谱,并基于所述知识图谱构造训练数据集;基于所述训练数据集训练形成检测模型;将待检测的知识图谱输入所述检测模型进行错误检测,获取与所述待检测的知识图谱对应的错误链接;对所述错误链接进行修正,并提供与所述错误链接对应的潜在的实体间的匹配关系;其中,获取错误链接Terr和空集的正确链接集合Tcorr;其中,Terr中的元素包含错误三元组和置信度;其中,设Terr中的三元组为t=s,p,o,置信度为score_t,其中,s和o分别表示实体,p为实体s和o之间的链接,对Terr中的元素做遍历;分别计算获取s的类型s_tp,以及o的类型o_tp,如果s_tp和s的实际类型不一致,计算在将s类型换成s_tp时,三元组s,p,o的置信度,如果置信度达到理想阈值以上,则认为该三元组被归类为潜在错误是因为类型错误的原因导致,此时可针对该类型错误按照预设方法进行修正;o和s的处理过程同理;5如果发现潜在错误三元组不是因为类型错误导致,则认为该三元组确系潜在链接错误;6对s获取候选集s_cand,对o取得候选集o_cand;7构建候选三元组{s_i,p,o|s_i∈S_cand}∪{s,p,o_i|o_i∈o_cand},该候选三元组用T_cand表示;8假设T为知识图谱已有的三元组集合,取T_cand和T的差集,即T_cand–T,重新赋值T_cand;9对T_cand中的三元组进行遍历,设该三元组为c;10对c进行置信度计算,得到score_c;11定义mc为最小置信阈值,mcg为最小置信增益阈值;12如果score_c=mc且score_cscore_t=mcg,则c为潜在修正三元组;13对潜在修正三元组集合中求置信度最高的三元组,记为c_best;14至此t由c_best来修正,Tcorr赋值为Tcorr∪{c_best,t。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 知识图谱链接错误的查修方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。