申请/专利权人:河北工程大学
申请日:2020-04-02
公开(公告)日:2023-03-14
公开(公告)号:CN111460159B
主分类号:G06F16/35
分类号:G06F16/35;G06F40/289;G06Q50/26
优先权:
专利状态码:有效-授权
法律状态:2023.03.14#授权;2020.08.21#实质审查的生效;2020.07.28#公开
摘要:本发明适用于数据处理技术领域,提供了一种安防大数据的模块化本体构建方法、装置及终端设备,所述方法包括:获取安防大数据,并对所述安防大数据进行数据预处理,得到概念候选集合;从概念候选集合中提取目标概念,并确定目标概念对应的公共安全事件;对各个公共安全事件对应的目标概念分别进行CURE聚类;根据各个公共安全事件对应的CURE聚类结果,创建各个公共安全事件对应的本体模块,并采用本体推理规则连接各个本体模块,得到安防模块化本体。本申请通过对安防大数据本体模块化,实现各个本体之间的关联,能够在不影响其他模块的前提下仅仅针对需要更新的本体进行更新,从而减少本体构建的复杂度。
主权项:1.一种安防大数据的模块化本体构建方法,其特征在于,包括:获取安防大数据,并对所述安防大数据进行数据预处理,得到概念候选集合;从所述概念候选集合中提取目标概念,并确定所述目标概念对应的公共安全事件;对各个公共安全事件对应的目标概念分别进行CURE聚类,获取各个公共安全事件对应的CURE聚类结果;根据各个公共安全事件对应的CURE聚类结果,创建各个公共安全事件对应的本体模块,并采用本体推理规则连接各个本体模块,得到安防模块化本体;所述对所述安防大数据进行数据预处理,得到概念候选集合,包括:对所述安防大数据进行分词处理,得到分词词组集合;根据预设停用词表对所述分词词组集合中的停用词进行过滤,得到所述概念候选集合;所述方法还包括:获取扩展关键词,并获取出现过所述扩展关键词的前N篇文档中用户点击率最多的文本作为所述扩展关键词对应的文本信息;提取文本信息中与所述扩展关键词相关联的关键词作为关联关键词,并将所述扩展关键词与所述关联关键词组成新增模块;将所述文本信息中出现的所述安防模块化本体中的关键词作为初始关键词,对所述新增模块中的关键词与初始关键词通过语义相似度算法进行对比,将与所述新增模块中关键词相似度较大的初始关键词作为目标关键词;将所述目标关键词与所述新增模块中对应的关键词建立层次连接关系;若所述新增模块的关键词与初始关键词没有相似性,则将所述新增模块添加至所述本体模块中;若所述新增模块中的关键词的一个下位关键词与所述本体模块的关键词的下位关键词相似度较大,则将所述新增模块添加至所述本体模块,并将所述本体模块中的关键词与所述新增模块的关键词的下位关键词建立连接;若所述新增模块中的关键词与所述本体模块的关键词相同,但所述本体模块的关键词没有下位关键词,则将所述新增模块的关键词的下位关键词与所述本体模块的关键词建立层次连接关系。
全文数据:
权利要求:
百度查询: 河北工程大学 安防大数据的模块化本体构建方法、装置及终端设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。