买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于开放百科图谱的领域图谱关系的判定方法及系统_中译语通科技股份有限公司_202011535423.5 

申请/专利权人:中译语通科技股份有限公司

申请日:2020-12-23

公开(公告)日:2024-04-02

公开(公告)号:CN112528045B

主分类号:G06F16/36

分类号:G06F16/36;G06N3/045;G06N3/042;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2021.04.06#实质审查的生效;2021.03.19#公开

摘要:本发明公开了一种基于开放百科图谱的领域图谱关系的判定方法及系统,其中,该判定方法包括:构建百科知识图谱;对图卷积网络模型进行训练;基于所述百科知识图谱以及训练后的所述图卷积网络模型确定出领域图谱的实体关系类型。本发明的基于开放百科图谱的领域图谱关系的判定方法及系统能够将开放的百科知识进行领域迁移,对非结构化构建的领域图谱进行关系增强,能在不进行语料标注的情况下快速完成高质量的关系图谱的构建以及关系判定。

主权项:1.一种基于开放百科图谱的领域图谱关系的判定方法,其特征在于,包括:构建百科知识图谱;对图卷积网络模型进行训练;基于所述百科知识图谱以及训练后的所述图卷积网络模型确定出领域图谱的实体关系类型;其中,对图卷积网络模型进行训练包括:若领域图谱中具有人工标注的结构化的三元组数据,则将所述人工标注的结构化的三元组数据作为验证集;采用所述验证集对所述图卷积网络模型的参数进行优化;其中,对所述图卷积网络模型进行训练包括:若领域图谱中不具有人工标注的结构化的三元组数据,则采用交叉验证的方式训练所述图卷积网络模型;其中,所述采用交叉验证的方式训练所述图卷积网络模型包括:在所述百科知识图谱中忽略边的关系类型,生成第一邻接矩阵;在所述百科知识图谱中保留边的关系类型,生成第二邻接矩阵,其中,所述第二邻接矩阵是异构邻接矩阵;采用传统GCN工具对所述第一邻接矩阵进行迭代训练,生成第一图卷积网络模型;采用传统GCN工具对所述第二邻接矩阵进行迭代训练,生成第二图卷积网络模型以及边的语义嵌入表示;其中,基于所述百科知识图谱以及训练后的所述图卷积网络模型确定出领域图谱的实体关系类型包括:加载所述第一图卷积网络模型;在所述领域图谱中忽略边的关系类型,生成第三邻接矩阵;根据所述第一图卷积网络模型以及所述第三邻接矩阵对所述领域图谱中的两个实体之间的关系进行链接预测,输出预测概率;将所述预测概率与预设阈值进行比较,若所述预测概率高于所述预设阈值,则判定两个实体之间具有确定的关系;根据所述百科知识图谱判断具有确定的关系的两个实体之间的关系类型,若所述百科知识图谱中的该两个实体之间的关系类型是唯一的,则将该唯一的关系类型确定为该两个实体之间的关系类型;所述判定方法还包括:若所述百科知识图谱中的该两个实体之间的关系类型不是唯一的,则借助关系线索进行消歧,其中,所述借助关系线索进行消歧包括:从所述第二图卷积网络模型中加载所述边的语义嵌入表示;读取并加载该两个实体之间的原始文本,且根据该原始文本获取关系线索集合;将所述关系线索集合转化为多个线索语义向量,其中,一个关系线索对应一个线索语义向量;采用余弦相似度算法计算每个所述线索语义向量和所述边的语义嵌入表示向量之间的语义相似度值,将最大的所述语义相似度值所对应的关系线索确定为该两个实体之间的关系类型。

全文数据:

权利要求:

百度查询: 中译语通科技股份有限公司 基于开放百科图谱的领域图谱关系的判定方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。