买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于本体库的标签管理方法_上海大学_201710539796.1 

申请/专利权人:上海大学

申请日:2017-07-05

公开(公告)日:2020-11-24

公开(公告)号:CN107491479B

主分类号:G06F16/33(20190101)

分类号:G06F16/33(20190101);G06F16/36(20190101);G06F16/48(20190101)

优先权:

专利状态码:有效-授权

法律状态:2020.11.24#授权;2018.01.12#实质审查的生效;2017.12.19#公开

摘要:本发明涉及一种基于本体库的标签管理方法,通过多层语义标签提取实现对媒体资产标注,并基于本体推理规则实现语义标签管理。用户通过管理端上传图片到图片数据库后,通过基于本体的多层语义标签库生成模块对图片处理,得到多层语义标签并存储到本体标签库中;通过基于本体推理规则的标签库生成模块对用户提交新标签进行处理。先将新标签加入现有标签库内容中,得到混合标签库;然后根据推理规则,处理混合标签库,得到最优化本体;最后,保存最优化本体并更新本体库。用户使用时提交查询信息到标签库中查询,若命中,则将标签查询结果返回用户;否则,则将查询信息通过相似度计算模块进行相似度计算后,得到查询信息相关推荐信息并返回给用户。

主权项:1.一种基于本体库的标签管理方法,通过多层语义标签提取实现对媒体资产进行标注,基于本体推理规则对语义标签动态更新,并基于本体库的标签搜索方法有利于提升媒体资产的管理效率,其特征在于,所述多层语义标签提取具体为:A1用户通过管理端提交图片数据库到多层语义标签库模块;A2多层语义标签库模块对管理端提交的图片数据库进行处理,得到基于本体的多层语义标签数据库,并输入到本体标签库中;所述基于本体推理规则具体为:B1用户通过管理端提交标签数据库到基于本体推理规则的标签库生成模块;B2基于本体推理规则的标签库生成模块获取本体标签库中内容,并将管理端输入的标签数据库与所获取的本体标签库中内容进行组合,得到混合的标签库;B3用户通过管理端建立本体规则库,随后基于本体推理规则的标签库生成模块结合规则库对混合标签库进行基于规则的推理、创建新的关联关系、淘汰掉冗余标签,得到最优化标签树;B4基于本体推理规则的标签库生成模块向本体标签库发送最优化标签树,并更新本体标签库中内容;所述基于本体库的标签搜索方法具体为:C1用户提交需要查询的用户自定义标签;C2对用户自定义标签在本体标签库中进行查找,并将查找结果返回给用户。

全文数据:一种基于本体库的标签管理方法技术领域[0001]本发明涉及媒体资产管理领域,具体涉及一种基于本体库的标签管理方法。背景技术[0002]大数据时代的来临的一个表现就是以文本、图片、音频、视频为代表的数字媒体资产在数据量和内容多样性呈现暴增,同时人们对数字媒体资产的认知度和使用率也越来越频繁,数字媒体资产以多种应用形式广泛应用于公众及各个行业领域,尤其表现在媒体资产管理方面。[0003]目前,在数字媒体资产管理相关应用行业,现有的管理方法需要依赖媒体资源附加的标签信息来为用户提供检索服务,均采用了基于文本的标签或者基于内容的标签管理的方法。基于文本的标签管理方法是基于关键词的匹配查找过程,它是在对文本、图像、音视频等进行文本标注的基础上,进行文本、图像特征抽取,建立索引数据库,再进行基于关键字的检索与管理。基于内容的标签管理方法是直接从图像、视频中提取客观的视觉特征如颜色、纹理、形状等),通过匹配图像、视频帧之间的视觉特征来进行检索和管理。[0004]上述现有技术提供的标签管理的方法存在明显的缺陷。[0005]现有技术是一种基于文本或内容的标签管理的方法。但是,在实际中,基于内容生成的标签因为低层视觉特征与高层语义概念之间存在“语义鸿沟”,并且当融合多种视觉特征时,图像表示所需要的数据的维度通常很大,由此引发的“维度灾难”问题。基于文本的标签管理,由于不依靠内容,提取的标签可能与文本、图像、音视频所表达的内容并不相关,从而严重影响了现有标签管理方法的性能。而且,现在媒体资产数量呈现出几何数级的增长,这也使得人工基于文本标注变得费时费力。[0006]现有一部分标签管理方法基本是靠管理端手动进行管理,需要人为修改标签内容,以及对不必要的标签进行手动剔除,巨大的标签数目让管理变得耗时耗力;还有一部分标签管理方法是开放权限允许用户进行输入,由于用户的知识水平差异,导致具有同种含义的标签数目产生巨大增长,并且,用户对事物的描述与理解能力的不同,使得大量无意义标签存在。因此,为了有效地提高图像检索方法的性能,如何高效、准确地进行自动图像语义标注,近年来己经成为学术界和工业界共同关注的热点研究问题。[0007]本发明应用本体工具管理图片,利用本体可以帮助计算机从多种角度分析数字媒体的语义信息。传统标签管理只是标签的简单模式匹配,而没有能够关注标签的语义概念本身及其相关关系。而利用本体来刻画不同语言中对应的领域知识,以解决从查询标签到检索标签之间转换过程中出现的语义损失和曲解等问题,从而保证在管理过程中能够有效地遵循管理端的意图,获得预期的管理效果。发明内容[0008]本发明的目的是针对上述问题,提供一种用于媒体资产管理的基于本体库的标签管理方法。[0009]本发明的目的可以通过以下技术方案来实现:[0010]一种基于本体库的标签管理方法,通过多层语义标签提取实现对媒体资产进行标注,基于本体推理规则对语义标签动态更新,并基于本体库的标签搜索方法有利于提升媒体资产的管理效率。[0011]所述多层语义标签提取具体为:[0012]Al用户通过管理端提交图片数据库到多层语义标签库模块;[0013]A2多层语义标签库模块对管理端提交的图片数据库进行处理,得到基于本体的多层语义标签数据库,并输入到本体标签库中;[0014]所述基于本体推理规则具体为:[0015]BI用户通过管理端提交标签数据库到基于本体推理规则的标签库生成模块;[0016]B2基于本体推理规则的标签库生成模块获取本体标签库中内容,并将管理端输入的标签数据库与所获取的本体标签库中内容进行组合,得到混合的标签库;[0017]B3用户通过管理端建立本体规则库,随后基于本体推理规则的标签库生成模块结合规则库对混合标签库进行基于规则的推理、创建新的关联关系、淘汰掉冗余标签,得到最优化标签树;[0018]B4基于本体推理规则的标签库生成模块向本体标签库发送最优化标签树,并更新本体标签库中内容;[0019]所述基于本体库的标签搜索方法具体为:[0020]Cl用户提交需要查询的用户自定义标签;[0021]C2对用户自定义标签在本体标签库中进行查找,并将查找结果返回给用户。[0022]所述步骤Al具体包含:[0023]Al1用户上传图片到图片数据库中;[0024]A12用户通过管理端对所有上传的图片进行审核,判断是否符合上传条件:[0025]若是,则管理端提交图片到多层语义标签库模块;若否,则作审核不通过处理。[0026]所述步骤BI具体包含:[0027]B11用户上传标签到标签数据库中;[0028]B12具有审核权限的用户通过管理端对上传的标签进行审核,判断是否符合上传条件:[0029]若是,则管理端提交标签到标签库;若否,则作审核不通过处理;[0030]B13标签数据库将标签提交到基于本体推理规则的标签库生成模块。[0031]所述步骤B3具体包含:[0032]B31基于本体推理规则的标签库生成模块获取标签的相似度计算信息,为新加入标签创建与现有本体中标签结点的关联关系,得到新本体标签树;[0033]B32用户创建本体规则库,并将规则库与推理工具绑定;[0034]B33根据推理规则和标签树调整算法,推理机对标签树结点位置进行调整,删除无用结点,得到最优化标签树。[0035]所述步骤B31具体包含:[0036]B311基于本体的多层次语义标签生成模块获取标签并输入本体标签库中,由基于本体推理规则的标签库生成模块创建标签的关联关系;[0037]B312手工调整,得到高可信度的本体标签关系,输入自建语料库保存。[0038]所述步骤Cl具体包含:[0039]C11将用户提交查询的自定义标签保存为查询记录,基于本体推理规则的标签生成模块将根据查询记录进行本体库中标签权重调整;[0040]C12将用户提交查询的自定义标签转化为本体标签库标签查询语言,并提交到本体标签库中查询。[0041]所述步骤C2具体包含:[0042]C21在本体标签库中寻找用户输入的自定义标签,判断用户输入自定义标签中是否包含未录入标签;[0043]C22若是,则将用户自定义标签提交给语义相似度计算模块;[0044]C23若否,则将该标签在本体标签库中查找,并将标签关联的图片结果反馈给用户。[0045]所述步骤C22在用户输入的自定义标签包含未录入标签时,进行语义相似度模块计算,具体包含:[0046]C221相似度计算模块获取并计算用户输入的自定义标签,得到语义词向量;[0047]C222相似度计算模块参照自建语料库,对语义词向量进行相似度计算,根据相似度,得到用户自定义标签的同义标签;[0048]C223相似度计算模块把同义标签按相似程度递减排序,作为推荐提供给用户选择;[0049]C224若用户选择推荐的同义标签来替换原有用户自定义标签,则将用户选择推荐的同义标签在本体标签库中进行查找,并将该同义标签关联的图片作为结果反馈;[0050]C225若用户不选择推荐的同义标签,则按相似度递减,将所有推荐同义标签分别在本体标签库中的查找,并将关联结果反馈。[0051]所述步骤C222具体包含:[0052]C2221语义相似度计算采用基于本体和语料库结合的方法,语义相似度计算模块从本体标签库获取已有本体;[0053]C2222语义相似度计算模块获取用户输入用户查询自定义标签wl后,且该用户自定义标签在本体标签库中不存在,则该模块从本体图获取一个标签结点w2,在自建语料库中查询已存在的关联关系,按照一种语义相似度计算算法,计算wl和w2的语义相似度,记为simwl,w2;所述simwl,w2计算方法如下:[0054]a.计算标签结点深度:找出标签wl和w2结点在本体层次体系中所处层次数,根结点深度为〇,所以记为^口1:11^1,16口1:11¥2;[0055]b.计算结点重合度:找出标签wl和w2在本体层次体系中所拥有相同父结点的路径长度,记为spdwl,w2;[0056]c.计算相异度:找出2个结点wl和w2在本体层次体系中沿父结点逐步上移,直到wl和w2到达第一个共同结点,走过的最短路径长度,记为dsdwl,w2,相异度与语义距离等价;[0057]d.根据深度、相异度、重合度对结点计算相似度,计算公式如下:[0058][0059]C2223语义相似度计算模块依次遍历本体中所有结点,获取该查询关键词与所有结点的相似度,存储在自建语料库中。[0060]与现有技术相比,本发明具有以下优点:[0061]1构建数字媒体领域的知识本体,将标签库用本体关联关系存储在非结构化数据库中,通过标签与非结构化数据相关联,与关系型数据库相比较存储、修改更加灵活,查询更为快捷精准。[0062]2通过计算语义相似相关度拓展用户的搜索条件,扩大了搜索结果的覆盖范围,更加便于用户查询到相关数据。[0063]3通过多层语义计算模块得到多层语义标签,可以实现同种资源多种描述,有利于降低搜索关键词限制,提升查询结果的精确性。[0064]4该方法能够根据图片源和标签数据库来更新实时更新本体库中标签权值,通过推理机制实现了自我淘汰与迭代功能,更具有时效性,准确度更高。附图说明[0065]图1是本发明提供的一种基于本体库的标签管理方法架构图。[0066]图2是本发明提供的一种自建语料库建立方法图。具体实施方式[0067]下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。[0068]如图1所示,一种基于本体库的标签管理方法,通过多层语义标签提取实现对媒体资产进行标注,基于本体推理规则对语义标签动态更新,并基于本体库的标签搜索方法有利于提升媒体资产的管理效率。[0069]所述多层语义标签提取具体为:[0070]Al用户通过管理端提交图片数据库到多层语义标签库模块;[0071]All用户上传图片到图片数据库中;[0072]A12用户通过管理端对所有上传的图片进行审核,判断是否符合上传条件:[0073]若是,则管理端提交图片到多层语义标签库模块;若否,则作审核不通过处理。[0074]A2多层语义标签库模块对管理端提交的图片数据库进行处理,得到基于本体的多层语义标签数据库,并输入到本体标签库中;[0075]所述基于本体推理规则具体为:[0076]BI用户通过管理端提交标签数据库到基于本体推理规则的标签库生成模块;[0077]B11用户上传标签到标签数据库中;[0078]B12具有审核权限的用户通过管理端对上传的标签进行审核,判断是否符合上传条件:若是,则管理端提交标签到标签库;若否,则作审核不通过处理;[0079]B13标签数据库将标签提交到基于本体推理规则的标签库生成模块。[0080]B2基于本体推理规则的标签库生成模块获取本体标签库中内容,并将管理端输入的标签数据库与所获取的本体标签库中内容进行组合,得到混合的标签库;[0081]B3用户通过管理端建立本体规则库,随后基于本体推理规则的标签库生成模块结合规则库对混合标签库进行基于规则的推理、创建新的关联关系、淘汰掉冗余标签,得到最优化标签树;[0082]B31基于本体推理规则的标签库生成模块获取标签的相似度计算信息,为新加入标签创建与现有本体中标签结点的关联关系,得到新本体标签树;[0083]B311基于本体的多层次语义标签生成模块获取标签并输入本体标签库中,由基于本体推理规则的标签库生成模块创建标签的关联关系;[0084]B312手工调整,得到高可信度的本体标签关系,输入自建语料库保存;[0085]B32用户创建本体规则库,并将规则库与推理工具绑定;[0086]B33根据推理规则和标签树调整算法,推理机对标签树结点位置进行调整,删除无用结点,得到最优化标签树;[0087]B4基于本体推理规则的标签库生成模块向本体标签库发送最优化标签树,并更新本体标签库中内容;[0088]如图2所示,所述基于本体库的标签搜索方法具体为:[0089]Cl用户提交需要查询的用户自定义标签;[0090]C11将用户提交查询的自定义标签保存为查询记录,基于本体推理规则的标签生成模块将根据查询记录进行本体库中标签权重调整;[0091]C12将用户提交查询的自定义标签转化为本体标签库标签查询语言,并提交到本体标签库中查询;[0092]C2对用户自定义标签在本体标签库中进行查找,并将查找结果返回给用户;[0093]C21在本体标签库中寻找用户输入的自定义标签,判断用户输入自定义标签中是否包含未录入标签;[0094]C22若是,则将用户自定义标签提交给语义相似度计算模块;[0095]C221相似度计算模块获取并计算用户输入的自定义标签,得到语义词向量;[0096]C222相似度计算模块参照自建语料库,对语义词向量进行相似度计算,根据相似度,得到用户自定义标签的同义标签;[0097]C2221语义相似度计算采用基于本体和语料库结合的方法,语义相似度计算模块从本体标签库获取已有本体;[0098]C2222语义相似度计算模块获取用户输入用户查询自定义标签wl后,且该用户自定义标签在本体标签库中不存在,则该模块从本体图获取一个标签结点w2,在自建语料库中查询已存在的关联关系,按照一种语义相似度计算算法,计算wl和w2的语义相似度,记为simwl,w2;所述simwl,w2计算方法如下:[0099]a.计算标签结点深度:找出标签wl和w2结点在本体层次体系中所处层次数,根结点深度为〇,所以记为^口1:11^1,16口1:11¥2;[0100]b.计算结点重合度:找出标签wl和w2在本体层次体系中所拥有相同父结点的路径长度,记为spdwl,w2;[0101]c.计算相异度:找出2个结点wl和w2在本体层次体系中沿父结点逐步上移,直到wl和w2到达第一个共同结点,走过的最短路径长度,记为dsdwl,w2,相异度与语义距离等价;[0102]d.根据深度、相异度、重合度对结点计算相似度,计算公式如下:[0103][0104]C2223语义相似度计算模块依次遍历本体中所有结点,获取该查询关键词与所有结点的相似度,存储在自建语料库中;[0105]C223相似度计算模块把同义标签按相似程度递减排序,作为推荐提供给用户选择;[0106]C224若用户选择推荐的同义标签来替换原有用户自定义标签,则将用户选择推荐的同义标签在本体标签库中进行查找,并将该同义标签关联的图片作为结果反馈;[0107]C225若用户不选择推荐的同义标签,则按相似度递减,将所有推荐同义标签分别在本体标签库中的查找,并将关联结果反馈。[0108]C23若否,则将该标签在本体标签库中查找,并将标签关联的图片结果反馈给用户。

权利要求:1.一种基于本体库的标签管理方法,通过多层语义标签提取实现对媒体资产进行标注,基于本体推理规则对语义标签动态更新,并基于本体库的标签搜索方法有利于提升媒体资产的管理效率,其特征在于,所述多层语义标签提取具体为:Al用户通过管理端提交图片数据库到多层语义标签库模块;A2多层语义标签库模块对管理端提交的图片数据库进行处理,得到基于本体的多层语义标签数据库,并输入到本体标签库中;所述基于本体推理规则具体为:BI用户通过管理端提交标签数据库到基于本体推理规则的标签库生成模块;B2基于本体推理规则的标签库生成模块获取本体标签库中内容,并将管理端输入的标签数据库与所获取的本体标签库中内容进行组合,得到混合的标签库;B3用户通过管理端建立本体规则库,随后基于本体推理规则的标签库生成模块结合规则库对混合标签库进行基于规则的推理、创建新的关联关系、淘汰掉冗余标签,得到最优化标签树;B4基于本体推理规则的标签库生成模块向本体标签库发送最优化标签树,并更新本体标签库中内容;所述基于本体库的标签搜索方法具体为:Cl用户提交需要查询的用户自定义标签;C2对用户自定义标签在本体标签库中进行查找,并将查找结果返回给用户。2.根据权利要求1所述的基于本体库的标签管理方法,其特征在于,所述步骤Al具体包含:Al1用户上传图片到图片数据库中;A12用户通过管理端对所有上传的图片进行审核,判断是否符合上传条件:若是,则管理端提交图片到多层语义标签库模块;若否,则作审核不通过处理。3.根据权利要求1所述的基于本体库的标签管理方法,其特征在于,所述步骤BI具体包含:B11用户上传标签到标签数据库中;B12具有审核权限的用户通过管理端对上传的标签进行审核,判断是否符合上传条件:若是,则管理端提交标签到标签库;若否,则作审核不通过处理;B13标签数据库将标签提交到基于本体推理规则的标签库生成模块。4.根据权利要求1所述的基于本体库的标签管理方法,其特征在于,所述步骤B3具体包含:B31基于本体推理规则的标签库生成模块获取标签的相似度计算信息,为新加入标签创建与现有本体中标签结点的关联关系,得到新本体标签树;B32用户创建本体规则库,并将规则库与推理工具绑定;B33根据推理规则和标签树调整算法,推理机对标签树结点位置进行调整,删除无用结点,得到最优化标签树。5.根据权利要求4所述的基于本体库的标签管理方法,其特征在于,所述步骤B31具体包含:B311基于本体的多层次语义标签生成模块获取标签并输入本体标签库中,由基于本体推理规则的标签库生成模块创建标签的关联关系;B312手工调整,得到高可信度的本体标签关系,输入自建语料库保存。6.根据权利要求1所述的基于本体库的标签管理方法,其特征在于,所述步骤Cl具体包含:C11将用户提交查询的自定义标签保存为查询记录,基于本体推理规则的标签生成模块将根据查询记录进行本体库中标签权重调整;C12将用户提交查询的自定义标签转化为本体标签库标签查询语言,并提交到本体标签库中查询。7.根据权利要求1所述的基于本体库的标签管理方法,其特征在于,所述步骤C2具体包含:C21在本体标签库中寻找用户输入的自定义标签,判断用户输入自定义标签中是否包含未录入标签;C22若是,则将用户自定义标签提交给语义相似度计算模块;C23若否,则将该标签在本体标签库中查找,并将标签关联的图片结果反馈给用户。8.根据权利要求7所述的基于本体库的标签管理方法,其特征在于,所述步骤C22在用户输入的自定义标签包含未录入标签时,进行语义相似度模块计算,具体包含:C221相似度计算模块获取并计算用户输入的自定义标签,得到语义词向量;C222相似度计算模块参照自建语料库,对语义词向量进行相似度计算,根据相似度,得到用户自定义标签的同义标签;C223相似度计算模块把同义标签按相似程度递减排序,作为推荐提供给用户选择;C224若用户选择推荐的同义标签来替换原有用户自定义标签,则将用户选择推荐的同义标签在本体标签库中进行查找,并将该同义标签关联的图片作为结果反馈;C225若用户不选择推荐的同义标签,则按相似度递减,将所有推荐同义标签分别在本体标签库中的查找,并将关联结果反馈。9.根据权利要求8所述的基于本体库的标签管理方法,其特征在于,所述步骤C222具体包含:C2221语义相似度计算采用基于本体和语料库结合的方法,语义相似度计算模块从本体标签库获取已有本体;C2222语义相似度计算模块获取用户输入用户查询自定义标签wl后,且该用户自定义标签在本体标签库中不存在,则该模块从本体图获取一个标签结点w2,在自建语料库中查询已存在的关联关系,按照一种语义相似度计算算法,计算wl和w2的语义相似度,记为simwl,w2;所述simwl,w2计算方法如下:a.计算标签结点深度:找出标签wl和w2结点在本体层次体系中所处层次数,根结点深度为〇,所以记为^口1:11¥1,16口1:11¥2;b.计算结点重合度:找出标签wl和w2在本体层次体系中所拥有相同父结点的路径长度,记为spdwl,w2;c.计算相异度:找出2个结点wl和w2在本体层次体系中沿父结点逐步上移,直到wl和w2到达第一个共同结点,走过的最短路径长度,记为dsdwl,w2,相异度与语义距离等价;d.根据深度、相异度、重合度对结点计算相似度,计算公式如下:C2223语义相似度计算模块依次遍历本体中所有结点,获取该查询关键词与所有结点的相似度,存储在自建语料库中。

百度查询: 上海大学 一种基于本体库的标签管理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。