申请/专利权人:全球能源互联网研究院有限公司;国网山西省电力公司
申请日:2020-08-06
公开(公告)日:2024-03-29
公开(公告)号:CN111930774B
主分类号:G06F16/242
分类号:G06F16/242;G06F16/28;G06Q50/06
优先权:
专利状态码:有效-授权
法律状态:2024.03.29#授权;2020.12.01#实质审查的生效;2020.11.13#公开
摘要:本发明公开了一种电力知识图谱本体自动构建方法及系统,通过对多源关系型数据库SQL语言描述和表结构信息的分析,将电力系统各类应用的关系型数据库进行本体抽取与融合,形成电力本体候选集,利用基于图方法的本体聚类和消歧方法,形成本体图模型并自动更新本体及关系表达;根据不同业务需求,采用本体分层技术进行本体模型层级结构优化,将多个图模型进行融合形成具有分层描述功能的本体模型,充分利用了电力系统的数据结构与潜在知识连接,节约了大量的人力投入;能实现电力领域内本体的自动融合,构建的分层描述功能的本体模型将各类应用的知识进行统一表达,有助于进一步进行人工调整,大幅降低电力系统知识图谱构建的难度和复杂度。
主权项:1.一种电力知识图谱本体自动构建方法,其特征在于,包括如下步骤:获取电力系统多源关系型数据库,并对多源数据结构进行关系解析,生成初始候选本体集;对所述初始候选本体集依次进行本体聚类和本体消歧,更新本体及关系表达,生成知识模型本体,其中对所述初始候选本体集进行本体聚类的过程,包括:将初始候选本体集,分别通过word2vec词向量模型训练和动态字符串距离计算的方法,进行词语相似度分析,再根据分词统计结果,进行唯一性和关联性分析,设置相似度、唯一性和关联性阈值,通过初始候选本体集内容的相似度、唯一性和关联性进行本体聚类,形成初始本体图模型;基于业务需求,采用本体分层技术对知识模型本体分层,形成电力知识图谱的分层描述的本体模型,包括:根据知识模型本体中本体的相似度和关联度,将本体分为通用本体和特定业务本体,基于通用本体和特定业务本体构建由n个节点构成的图Gi=Vi,Ei,i指不同业务范围的本体模型,V是候选本体以及拓展之后的中间本体的集合,E是不同本体指称候选本体之间的边或本体指称和中间本体的边的集合,形成多层权重图M,M的第i层对应于Gi;每一层图单独构建完之后,将不同层之间的图进行连接优化,对不同层之间的同一个节点进行边的连接,通过权重计算和关联性分析,确定关联节点,最终形成电力知识图谱分层描述的本体模型。
全文数据:
权利要求:
百度查询: 全球能源互联网研究院有限公司;国网山西省电力公司 一种电力知识图谱本体自动构建方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。