申请/专利权人:南京师范大学
申请日:2024-03-07
公开(公告)日:2024-04-09
公开(公告)号:CN117852637A
主分类号:G06N5/022
分类号:G06N5/022;G06F40/279;G06F40/30
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.26#实质审查的生效;2024.04.09#公开
摘要:本发明涉及一种基于定义的学科概念知识体系自动构建方法与系统,用于提升机器理解、计算与推理的准确性,包括:建立概念关系的分类体系,包括学科概念的类型以及概念间的关系类型;基于辞典、公开主题词表等数据源获取核心概念集及其定义集,每个核心概念称为目标概念;使用自然语言处理方法依次从定义集中自动提取相关概念以及概念关系;基于概念关系的分类体系,通过计算词语相似度标准化概念关系,获得三元组结构的集合;基于三元组结构的集合,重构学科概念的语义网络,形成更加系统的、结构化的学科概念体系。这有助于科学理解与正确使用概念,也有利于学科知识的智能理解、计算与推理。
主权项:1.一种基于定义的学科概念知识体系自动构建方法,其特征在于,所述方法包括以下步骤:步骤1建立概念关系的分类体系,包括学科概念的类型以及概念间的关系类型;步骤2基于辞典、公开主题词表数据源获取目标概念集及其定义集,每个核心概念称为目标概念;步骤3使用自然语言处理方法依次从定义集中自动提取相关概念以及概念关系;步骤4基于概念关系的分类体系,通过计算词语相似度标准化概念关系,获得三元组结构的集合;步骤5基于三元组结构的集合,重构学科概念的语义网络,形成学科概念体系;其中,步骤3中使用条件随机场模型对定义集进行分词,获取一系列词元并依据特征进行标注,从而预测出每个词元的类别,实现自动抽取相关概念及概念关系,设定义的特征函数集为,其中表示能观测的定义集,表示无法直接判断的词元类型,在定义中该词元的条件概率为: ,式子中表示概念类型以及概念关系类型,是条件随机场模型的参数,步骤4中基于概念关系的分类体系,计算词语的余弦相似度自动判别目标概念与相关概念的关系类型,公式如下: ,其中,和分别表示两个词语的词向量,表示两个向量的点积,和分别表示向量的范数,标准化后的三元组集合为: ,其中,,,分别为第项标准化后的概念关系中的目标概念、关系、相关概念,表示先确定目标概念,表示根据目标概念确定相关概念,表示根据目标概念与相关概念确定二者关系。
全文数据:
权利要求:
百度查询: 南京师范大学 一种基于定义的学科概念知识体系自动构建方法与系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。