买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于目标体图像的目标体检索方法、系统及装置_中国科学院自动化研究所_201810460265.8 

申请/专利权人:中国科学院自动化研究所

申请日:2018-05-15

公开(公告)日:2021-01-12

公开(公告)号:CN108874889B

主分类号:G06F16/583(20190101)

分类号:G06F16/583(20190101);G06F16/55(20190101);G06N20/00(20190101);G06N3/04(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.01.12#授权;2018.12.18#实质审查的生效;2018.11.23#公开

摘要:本发明涉及图像处理技术领域,具体提供了一种基于目标体图像的目标体检索方法、系统及装置,旨在解决如何提高图像检索准确率的技术问题。为此目的,本发明中的目标体检索方法基于预先构建的图像检索模型提取目标体图像的图像特征,计算目标体图像的图像特征与预设的图像库中比对图像的图像特征的相似度,根据计算结果获取图像库中与目标体图像相似的比对图像,从而可以根据相似比对图像的图像类别确定目标体图像的图像类别。其中,本发明利用两步训练方法首先采用分类损失函数进行训练,然后采用双阈值损失函数进行训练对图像检索模型进行模型训练,可以提高图像检索模型的检索结果准确性。同时,本发明中的装置和系统能够实现上述目标体检索方法。

主权项:1.一种基于目标体图像的目标体检索方法,其特征在于包括:获取预设的图像训练样本的图像特征;基于预设的分类损失函数和所述图像训练样本的图像特征,并利用机器学习算法对预先构建的图像检索模型进行模型训练,得到初步优化模型;基于预设的双阈值损失函数和所述图像训练样本的图像特征,并利用机器学习算法对所述初步优化模型进行模型训练,得到最终优化模型;基于所述最终优化模型,提取目标体图像的图像特征;计算所述目标体图像的图像特征与预设的图像库中比对图像的图像特征的相似度;根据计算结果,获取所述图像库中与目标体图像相似的比对图像;其中,图像检索模型是基于Siamese网络框架的模型,所述双阈值损失函数如下式所示: 其中,所述LIp,Iq表示双阈值损失函数,所述Ip,Iq表示图像样本对,所述α1为相似图像样本对所对应的阈值,所述α2为不相似图像样本对所对应的阈值;所述y为所述图像样本对所对应的标签值,并且y=1表示所述图像样本对是相似图像样本对,y=0表示所述图像样本对是不相似图像样本对;所述d=||fIp-fIq||2,所述||fIp-fIq||2表示fIp-fIq的2范数,所述fIp为图像Ip的图像特征,所述fIq为图像Iq的图像特征。

全文数据:基于目标体图像的目标体检索方法、系统及装置技术领域[0001]本发明涉及图像处理技术领域,具体涉及一种基于目标体图像的目标体检索方法、系统及装置。背景技术[0002]图像检索技术指的是基于目标图像的文本、和或内容、和或语义信息,获取相似图像的图像处理技术。当前,可以利用基于机器学习算法的图像处理技术进行图像检索。例如,利用深度卷积神经网络,获取目标图像的图像特征,并根据所获取的图像特征检索相似图像。在此过程中,通常利用基于单阈值的对比损失函数,对深度卷积神经神经网络进行网络训练。但是,这种训练方式只为“不相似图像对”设置阈值,很难保证“相似图像”与“不相似图像”对损失函数的贡献比例相同,即在训练过程中侧重于“相似图像对”,降低了深度卷积神经网络的泛化能力,导致其无法准确检索未知类别图像的相似图像。发明内容[0003]为了解决现有技术中的上述问题,即为了解决如何提高图像检索准确率的技术问题。为此目的,本发明提供了一种基于目标体图像的目标体检索方法、系统及装置。[0004]在第一方面,本发明中的一种基于目标体图像的目标体检索方法包括如下步骤:[0005]基于预先构建的图像检索模型,提取目标体图像的图像特征;[0006]计算所述目标体图像的图像特征与预设的图像库中比对图像的图像特征的相似度;[0007]根据计算结果,获取所述图像库中与目标体图像相似的比对图像;[0008]其中,所述图像检索模型为基于预设的图像训练样本,并利用机器学习算法所构建的模型。[0009]进一步地,本发明提供的一个优选技术方案为:[0010]在“计算所述目标体图像的图像特征与预设的图像库中比对图像的图像特征的相似度”的步骤之前,所述方法还包括:[0011]根据所述图像库中比对图像的图像特征维度,对所述目标体图像的图像特征进行降维处理;[0012]在此情况下,“计算所述目标体图像的图像特征与预设的图像库中比对图像的图像特征的相似度”的步骤进一步包括计算所述降维处理后的目标体图像的图像特征与所述比对图像的图像特征的相似度。[0013]进一步地,本发明提供的一个优选技术方案为:[0014]“对所述目标体图像的图像特征进行降维处理”的步骤包括利用主成分分析法对所述目标体图像的图像特征进行降维处理。[0015]进一步地,本发明提供的一个优选技术方案为:[0016]所述图像检索模型是基于Siamese网络框架的模型;[0017]在“基于预先构建的图像检索模型,提取目标体图像的图像特征”的步骤之前,所述方法还包括:[0018]获取所述图像训练样本的图像特征;[0019]基于预设的分类损失函数和所述图像训练样本的图像特征,并利用机器学习算法对所述图像检索模型进行模型训练,得到初步优化模型;[0020]基于预设的双阈值损失函数和所述图像训练样本的图像特征,并利用机器学习算法对所述初步优化模型进行模型训练,得到最终优化模型。[0021]进一步地,本发明提供的一个优选技术方案为:[0022]在“基于预设的双阈值损失函数和所述图像训练样本的图像特征,并利用机器学习算法对所述初步优化模型进行模型训练,得到最终优化模型”的步骤之前,所述方法还包括:[0023]根据所述图像训练样本,获取相似图像样本对和不相似图像样本对;[0024]分别计算所述相似图像样本对的特征距离的概率分布和所述不相似图像样本对的特征距离的概率分布;[0025]根据所述概率分布,获取所述双阈值损失函数中所述相似图像样本对所对应的阈值和所述不相似图像样本对所对应的阈值。[0026]进一步地,本发明提供的一个优选技术方案为:[0027]在“基于预设的分类损失函数和所述图像训练样本的图像特征,并利用机器学习算法对所述图像检索模型进行模型训练,得到初步优化模型”的步骤之前,所述方法还包括:[0028]获取预先完成网络训练的神经网络的参数权重,并根据所述参数权重对所述图像检索模型进行参数权重初始化;[0029]其中,所述神经网络是基于ImageNet数据集,并利用所述机器学习算法进行网络训练得到的神经网络。[0030]进一步地,本发明提供的一个优选技术方案为:[0031]所述分类损失函数如下式所示:[0032]其中,所述L。表示分类损失函数,所述Wk为第k个预设的图像类别对应的权重,所述Pk为某个图像样本的图像类别是第k个图像类别的概率。[0033]进一步地,本发明提供的一个优选技术方案为:[0034]所述双阈值损失函数如下式所示:[0035]其中,所述LIP,Iq表示双阈值损失函数,所述(IP,Iq表示图像样本对,所述〇1为相似图像样本对所对应的阈值,所述〇2为不相似图像样本对所对应的阈值;所述y为所述图像样本对所对应的标签值,并且y=1表示所述图像样本对是相似图像样本对,y=〇表示所述图像样本对是不相似图像样本对;所述d=I|fiP-fIqI12,所述I|fiP-fIqI12表示fIP_fIq的2范数,所述fIp为图像Ip的图像特征,所述fIq为图像Iq的图像特征。[0036]在第二方面,本发明中的存储装置存储有多条程序,所述程序适于由处理器加载以执行上述技术方案所述的基于目标体图像的目标体检索方法。[0037]在第三方面,本发明中的控制装置包括处理器和存储设备,所述存储设备适于存储多条程序,所述程序适于由处理器加载以执行上述技术方案所述的基于目标体图像的目标体检索方法。[0038]与最接近的现有技术相比,上述技术方案至少具有如下有益效果:[0039]1、本发明中的基于目标体图像的目标体检索方法主要包括基于预先构建的图像检索模型提取目标体图像的图像特征,计算目标体图像的图像特征与预设的图像库中比对图像的图像特征的相似度,根据计算结果获取图像库中与目标体图像相似的比对图像,从而可以根据相似比对图像的图像类别确定目标体图像的图像类别。[0040]2、本发明中的基于目标体图像的目标体检索方法首先利用分类损失函数对图像检索模型进行模型训练得到初步优化模型,然后利用双阈值损失函数中对初步优化模型进行模型训练得到最终优化模型。基于此,能够保证在模型训练过程中相似图像样本对与不相似图像样本对的损失平衡,进而提高图像检索模型的图像识别性能。附图说明[0041]图1是本发明实施例中一种基于目标体图像的目标体检索方法的主要步骤示意图;[0042]图2是本发明实施例中一种图像检索模型的模型训练方法的主要步骤示意图;[0043]图3是本发明实施例中基于Siamese网络框架的图像检索模型的主要结构示意图;[0044]图4是本发明实施例中图像检索模型的测试过程示意图。具体实施方式[0045]下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。[0046]参阅附图1,图1示例性示出了本实施例中一种基于目标体图像的目标体检索方法的主要步骤。如图1所示,本实施例中可以按照如下步骤进行图像检索:[0047]步骤SlOl:基于预先构建的图像检索模型,提取目标体图像的图像特征。[0048]本实施例中图像检索模型是基于预设的图像训练样本,并利用机器学习算法所构建的模型。可选的,本实施例中图像检索模型可以是基于Siamese网络框架的AlexNet、VGGNet或ResNet等神经网络模型。。[0049]步骤S102:计算目标体图像的图像特征与预设的图像库中比对图像的图像特征的相似度。具体地,本实施例中可以按照如下步骤计算目标体图像与比对图像的相似度:[0050]步骤S1021:根据图像库中比对图像的图像特征维度,对目标体图像的图像特征进行降维处理。可选的,本实施例中可以利用主成分分析法对目标体图像的图像特征进行降维处理,使得目标体图像的图像特征维度与对比图像的图像特征维度相同。本实施例中图像库中比对图像的图像特征维度可以是64、128或256。[0051]步骤S1022:计算降维处理后的目标体图像的图像特征与比对图像的图像特征的相似度。可选的,本实施例中可以计算目标体图像的图像特征与比对图像的图像特征之间的余弦相似度。[0052]步骤S103:根据计算结果,获取图像库中与目标体图像相似的比对图像。具体地,本实施例中可以将最大相似度对应的比对图像作为目标体图像的相似图像。[0053]进一步地,本实施例中在利用图1所示的目标体检索方法检索目标体图像的相似图像之前,还可以对图像检索模型进行模型训练,来提高检索结果的准确性。下面结合附图,对本实施例中图像检索模型的模型训练方法进行说明。[0054]参阅附图2,图2示例性示出了本实施例中图像检索模型的模型训练方法的主要步骤。如图2所示,本实施例中可以按照如下步骤对图像检索模型进行模型训练:[0055]步骤S201:对图像检索模型进行参数初始化。[0056]具体地,本实施例中可以按照如下步骤对图像检索模型进行参数初始化:首先获取预先完成网络训练的神经网络的参数权重。然后,根据该神经网络的参数权重对图像检索模型进行参数权重初始化。其中,预先完成网络训练指的是基于ImageNet数据集,并利用机器学习算法进行网络训练得到的神经网络。[0057]步骤S202:获取图像训练样本的图像特征。[0058]具体地,本实施例中可以利用完成参数初始化的图像检索模型获取图像训练样本的图像特征。[0059]步骤S203:基于预设的分类损失函数和图像训练样本的图像特征,并利用机器学习算法对图像检索模型进行模型训练,得到初步优化模型。[0060]具体地,本实施例中分类损失函数可以是如下式⑴所示的交叉熵损失函数:1[0061]公式⑴中各参数含义为:[0062]L。表示分类损失函数,wk为第k个预设的图像类别对应的权重,pk为某个图像样本的图像类别是第k个图像类别的概率。[0063]步骤S204:获取双阈值损失函数中相似图像样本对所对应的阈值和不相似图像样本对所对应的阈值。[0064]具体地,本实施例中可以按照如下步骤获取相似图像样本和不相似图像样本对所对应的阈值:[0065]步骤S2041:根据图像训练样本,获取相似图像样本对和不相似图像样本对。[0066]具体地,本实施例中可以从图像训练样本中随机采样相似图像样本对和不相似图像样本对。[0067]步骤S2042:分别计算相似图像样本对的特征距离的概率分布和不相似图像样本对的特征距离的概率分布。[0068]具体地,本实施例中可以计算图像样本对相似图像样本对或不相似图像样本对)的特征距离之间的欧式距离,进而根据欧式距离得到相应的图像样本对的概率分布。[0069]步骤S2043:根据概率分布,获取双阈值损失函数中相似图像样本对所对应的阈值和不相似图像样本对所对应的阈值。[0070]具体地,本实施例中可以选取概率分布的平均值或中位数作为阈值初值,并利用实验测试的方法确定最终的阈值。[0071]步骤S205:基于预设的双阈值损失函数和图像训练样本的图像特征,并利用机器学习算法对初步优化模型进行模型训练,得到最终优化模型。可选的,本实施例中可以利用误差反向传播算法对初步优化模型进行模型训练。[0072]具体地,本实施例中双阈值损失函数可以是如下式⑵所示的损失函数:[0073]公式⑵中各参数含义为:[0074]LIp,Iq表示双阈值损失函数,(Ip,Iq表示图像样本对,αΑ相似图像样本对所对应的阈值,〇2为不相似图像样本对所对应的阈值述y为图像样本对所对应的标签值,并且y=1表示图像样本对是相似图像样本对,y=〇表示图像样本对是不相似图像样本对;d=I|f表示fIp-fIq的2范数,fIp为图像Ip的图像特征,fIq为图像Iq的图像特征。[0075]下面以预设的枪支图像库为例,对本实施例中图2所示的图像检索模型的模型训练方法进行说明。本实施例中的枪支图像库包含14755张枪支图像且这些枪支图像属于167个枪支类别。其中,图像训练样本包含107个枪支类别,图像验证样本包含20个枪支类别,图像测试样本包含40个枪支类别。[0076]具体地,本实施例中可以按照如下步骤对图像检索模型进行模型训练方法:[0077]步骤S301:对图像检索模型进行参数初始化。[0078]本实施例中的参数初始化方法与图2所示模型训练方法中的参数初始化方法相同,为了描述简洁,在此不再赘述。[0079]步骤S302:获取图像训练样本的图像特征。[0080]具体地,本实施例中在图像训练样本中采集约40万个图相对,利用图像检索模型提取每个所采集的图像训练样本的图像特征。[0081]步骤S303:利用交叉熵损失函数对图像检索模型进行模型训练,得到初步优化模型。[0082]步骤S304:分别计算相似图像样本对的特征距离的概率分布和不相似图像样本对的特征距离的概率分布。[0083]步骤S305:根据概率分布,获取双阈值损失函数中相似图像样本对所对应的阈值和不相似图像样本对所对应的阈值。[0084]具体地,本实施例中相似图像样本对所对应的阈值是0.8,不相似图像样本对所对应的阈值是1.2。[0085]步骤S306:使用双阈值损失函数和图像训练样本的图像特征,并利用机器学习算法对初步优化模型进行模型训练,得到最终优化模型。在此情况下,本实施例中还可以利用图像测试样本对最终优化模型进行测试,得到每个图像测试样本的特征向量。[0086]具体地,本实施例中每个枪支类别对应的图像训练样本包含180个相似图像样本对和180个不相似图像样本对。在模型训练过程中迭代周期为30,每个迭代周期包含602次迭代,每次迭代使用64个图像样本对。[0087]参阅附图3,图3示例性示出了本实施例中基于Siamese网络框架的图像检索模型的主要结构。如图3所示,本实施例中的图像检索模型是基于双分支Siamese网络框架的模型,某个图像样本对的两个图像样本分别输入至Siamese网络的两条支路中,依次进行卷积操作、提取特征、归一化处理和双阈值损失函数计算。[0088]参阅附图4,图4示例性示出了本实施例中图像检索模型的测试过程。如图4所示,本实施例中在测试过程中图像检索模型可以对图像测试样本依次进行卷积操作、提取特征和归一化处理,得到该图像测试样本的特征向量。[0089]至此,已完成对图像检索模型的模型训练和模型测试,可以利用上述训练好的图像检索模型对枪支图像进行检索,得到相似的枪支图像,进而判断出枪支的所属类别。[0090]上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述,但是本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时(并行执行或以颠倒的次序执行,这些简单的变化都在本发明的保护范围之内。[0091]进一步地,基于上述目标体检索方法实施例,本发明还提供了一种存储装置,该存储装置中存储有多条程序,并且这些程序可以适于由处理器加载以执行上述方法实施例所述的目标体检索方法。[0092]再进一步地,基于上述目标体检索方法实施例,本发明还提供了一种控制装置,该控制装置可以包括处理器和存储设备,存储设备可以适于存储多条程序,并且这些程序可以适于由处理器加载以执行上述方法实施例所述的目标体检索方法。[0093]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包括”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。[0094]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在本发明的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。[0095]至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

权利要求:1.一种基于目标体图像的目标体检索方法,其特征在于包括:基于预先构建的图像检索模型,提取目标体图像的图像特征;计算所述目标体图像的图像特征与预设的图像库中比对图像的图像特征的相似度;根据计算结果,获取所述图像库中与目标体图像相似的比对图像;其中,所述图像检索模型为基于预设的图像训练样本,并利用机器学习算法所构建的模型。2.根据权利要求1所述的基于目标体图像的目标体检索方法,其特征在于,在“计算所述目标体图像的图像特征与预设的图像库中比对图像的图像特征的相似度”的步骤之前,所述方法还包括:根据所述图像库中比对图像的图像特征维度,对所述目标体图像的图像特征进行降维处理;在此情况下,“计算所述目标体图像的图像特征与预设的图像库中比对图像的图像特征的相似度”的步骤进一步包括计算所述降维处理后的目标体图像的图像特征与所述比对图像的图像特征的相似度。3.根据权利要求2所述的基于目标体图像的目标体检索方法,其特征在于,“对所述目标体图像的图像特征进行降维处理”的步骤包括利用主成分分析法对所述目标体图像的图像特征进行降维处理。4.根据权利要求1-3中任一项所述的基于目标体图像的目标体检索方法,其特征在于,所述图像检索模型是基于Siamese网络框架的模型;在“基于预先构建的图像检索模型,提取目标体图像的图像特征”的步骤之前,所述方法还包括:获取所述图像训练样本的图像特征;基于预设的分类损失函数和所述图像训练样本的图像特征,并利用机器学习算法对所述图像检索模型进行模型训练,得到初步优化模型;基于预设的双阈值损失函数和所述图像训练样本的图像特征,并利用机器学习算法对所述初步优化模型进行模型训练,得到最终优化模型。5.根据权利要求4所述的基于目标体图像的目标体检索方法,其特征在于,在“基于预设的双阈值损失函数和所述图像训练样本的图像特征,并利用机器学习算法对所述初步优化模型进行模型训练,得到最终优化模型”的步骤之前,所述方法还包括:根据所述图像训练样本,获取相似图像样本对和不相似图像样本对;分别计算所述相似图像样本对的特征距离的概率分布和所述不相似图像样本对的特征距离的概率分布;根据所述概率分布,获取所述双阈值损失函数中所述相似图像样本对所对应的阈值和所述不相似图像样本对所对应的阈值。6.根据权利要求4所述的基于目标体图像的目标体检索方法,其特征在于,在“基于预设的分类损失函数和所述图像训练样本的图像特征,并利用机器学习算法对所述图像检索模型进行模型训练,得到初步优化模型”的步骤之前,所述方法还包括:获取预先完成网络训练的神经网络的参数权重,并根据所述参数权重对所述图像检索模型进行参数权重初始化;其中,所述神经网络是基于ImageNet数据集,并利用所述机器学习算法进行网络训练得到的神经网络。7.根据权利要求4所述的基于目标体图像的目标体检索方法,其特征在于,所述分类损失函数如下式所示:Lc=-WklogPk其中,所述L。表示分类损失函数,所述wk为第k个预设的图像类别对应的权重,所述pk为某个图像样本的图像类别是第k个图像类别的概率。8.根据权利要求4所述的基于目标体图像的目标体检索方法,其特征在于,所述双阈值损失函数如下式所示:其中,所述LIP,Iq表示双阈值损失函数,所述(IP,Iq表示图像样本对,所述Ct1为相似图像样本对所对应的阈值,所述〜为不相似图像样本对所对应的阈值;所述y为所述图像样本对所对应的标签值,并且y=l表示所述图像样本对是相似图像样本对,y=〇表示所述图像样本对是不相似图像样本对;所述d=IIfIp-fIqII2,所述IIfIp-fIqII2表示fIP_fIq的2范数,所述fIp为图像Ip的图像特征,所述fIq为图像Iq的图像特征。9.一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载以执行权利要求1-8中任一项所述的基于目标体图像的目标体检索方法。10.—种控制装置,包括处理器和存储设备,所述存储设备适于存储多条程序,其特征在于,所述程序适于由所述处理器加载以执行权利要求1-8中任一项所述的基于目标体图像的目标体检索方法。

百度查询: 中国科学院自动化研究所 基于目标体图像的目标体检索方法、系统及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。