买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种面向多源异构资源的本体融合前处理方法_哈尔滨工业大学_202010886887.4 

申请/专利权人:哈尔滨工业大学

申请日:2020-08-28

公开(公告)日:2020-11-27

公开(公告)号:CN112000725A

主分类号:G06F16/25(20190101)

分类号:G06F16/25(20190101);G06F16/28(20190101);G06F16/903(20190101);G06F16/36(20190101)

优先权:

专利状态码:有效-授权

法律状态:2023.03.21#授权;2020.12.15#实质审查的生效;2020.11.27#公开

摘要:本发明公开了一种面向多源异构资源的本体融合前处理方法,所述方法包括如下步骤:S1、提取本体模型中的实体概念;S2、提取本体模型中的关系概念;S3、提取本体模型中的属性概念;S4、导出JSON数据文件;S5、发现所要获取的数据存在的明显结构,用正则表达式表示上述两种结构;S6、返回满足正则表达式结构的内容在源数据的下标;S7、获取满足条件的子字符串;S8、对子字符串进一步做字符串匹配;S9、对每个源数据的标签进行融合;S10、存储数据,保存格式为结构化的格式。本发明能够根据本体建模的结果,将其转成JSON叙述,并给出面向异构半结构化数据的一致化融合的语法结构定义。

主权项:1.一种面向多源异构资源的本体融合前处理方法,其特征在于所述方法包括如下步骤:步骤S1、提取本体模型中的实体概念;步骤S2、提取本体模型中的关系概念;步骤S3、提取本体模型中的属性概念;步骤S4、存入Redis数据库并导出JSON数据文件;步骤S5、发现JSON数据文件中存在的明显结构:“字符+冒号+字符”或者“字符+等号+字符”,用正则表达式表示上述两种结构;步骤S6、返回满足正则表达式结构的内容在源数据的下标;步骤S7、获取满足条件的子字符串;步骤S8、对步骤S7获取的子字符串进一步做字符串匹配,提取出关键字和键值;步骤S9、对每个源数据的标签进行融合:重复步骤S5到S8,根据多标签融合方法,将多个同义标签融合成一个标签;步骤S10、存储数据,保存格式为结构化的格式。

全文数据:

权利要求:

百度查询: 哈尔滨工业大学 一种面向多源异构资源的本体融合前处理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。