买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于标准知识图谱的标准文档冲突检测方法及系统_华南理工大学_202110732648.8 

申请/专利权人:华南理工大学

申请日:2021-06-29

公开(公告)日:2022-09-20

公开(公告)号:CN113449118B

主分类号:G06F16/36

分类号:G06F16/36;G06K9/62

优先权:

专利状态码:有效-授权

法律状态:2022.09.20#授权;2021.10.22#实质审查的生效;2021.09.28#公开

摘要:本发明公开了一种基于标准知识图谱的标准文档冲突检测方法及系统,所述方法首先对标准文档的非结构化文本内容进行结构化抽取,形成标准知识图谱。基于该标准知识图谱,通过文本相似度匹配,多实体列表匹配等技术找出若干标准知识图谱间的冲突实体,实现标准文档间的冲突检测。所述方法具有良好的标准文档冲突检测能力,在给定若干标准文档下,能够对各个标准文档中的知识进行结构化,形成若干标准知识图谱,并通过标准知识图谱实现标准文档冲突检测,可广泛应用于标准编写领域。

主权项:1.一种基于标准知识图谱的标准文档冲突检测方法,其特征在于,所述方法包括以下步骤:1、对于标准文档D,通过命名实体识别、关系抽取从D中抽取若干实体、属性及其关系,构建成相对应的标准知识图谱GD,知识图谱由若干条三元组构成,每一个三元组包含头实体、关系和尾实体三个元素;2、对于两个构建好的标准知识图谱和对其中的三元组进行分类,分为唯一尾实体三元组和多尾实体三元组,具体包括:2.1、唯一尾实体三元组即对于某一头实体和某一关系只存在唯一相对应的尾实体;2.2、多尾实体三元组即对于某一头实体和某一关系存在多个尾实体,即该标准文档中,存在多条具有相同头实体和关系的三元组;3、对于和中具有相同头实体和关系的唯一尾实体三元组,采用Ratcliff-Obershelp文本相似度算法对比相同头实体的唯一关系三元组的尾实体间的相似度,具体包括:3.1、假设两个标准知识图谱和中,存在唯一尾实体三元组T1和T2,T1和T2具有相同头实体和关系,T1和T2的头实体和关系均为H和R,尾实体分别为和3.2、通过Ratcliff-Obershelp相似度算法计算和之间的相似度,若相似度为1,则说明和完全一样,不存在冲突;若和之间相似度小于1,那则两个实体不相同,存在冲突,且相似度越小,冲突程度越大;4、对于和中具有相同头实体和关系的多尾实体三元组,采用最大列表匹配算法,对具有相同头实体的多关系三元组列表中的所有三元组采用Ratcliff-Obershelp文本相似度算法依次计算相似度,并取列表匹配度最高的匹配作为匹配结果;4.1、假设两个标准知识图谱和中,存在若干多尾实体三元组,若干多尾实体三元组具有相同头实体和关系,其头实体和关系均为H和R,尾实体列表分别为即中有m个与H和R关联的尾实体,即中有n个与H和R关联的尾实体;4.2、对于每一个在W1中的实体Wi1,1≤i≤m,通过Ratcliff-Obershelp相似度算法计算Wi1和W2中所有实体Wj2,1≤j≤n的相似度,得到两个列表的相似度矩阵S∈Ri×j,i、j表示在某个范围内任取一个,R表示实数集;4.3、对于两个尾实体列表,需要找到两两匹配;通过遍历所有可能的两两组合,根据相似度矩阵S计算出该组合的相似度总和,遍历完成后,得到两个列表相似度最高时的匹配组合,若该匹配组合中所有匹配的相似度均为1,则这两个尾实体列表无冲突;如果存在匹配相似度小于1,那么存在不相同的尾实体,存在冲突,且相似度越小,冲突程度越大;根据两种三元组的相似度匹配结果输出最终两个文档D1和D2间的冲突检测结果;输出的冲突检测结果是通过相似度得到的:相似度小于1,那么这两个实体不相同,存在冲突,且相似度越小,冲突程度越大。

全文数据:

权利要求:

百度查询: 华南理工大学 一种基于标准知识图谱的标准文档冲突检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。