买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于经验拟合的局部敏感哈希图像检索参数优化方法_南京邮电大学_201810594762.7 

申请/专利权人:南京邮电大学

申请日:2018-06-11

公开(公告)日:2022-09-20

公开(公告)号:CN108959427B

主分类号:G06F16/583

分类号:G06F16/583;G06F16/51;G06V10/44;G06V10/77

优先权:

专利状态码:有效-授权

法律状态:2022.09.20#授权;2019.01.01#实质审查的生效;2018.12.07#公开

摘要:一种基于经验拟合的局部敏感哈希图像检索参数优化方法,包括如下步骤:S1、定义局部敏感哈希函数族H;S2、设k为局部敏感哈希函数的个数,L为哈希索引表的个数,当L,r,w的值确定时,计算出k值;S3、从H中取k个函数,定义k维局部敏感哈希函数族G;S4、从G中取L个哈希函数,建立L张哈希索引表。本发明通过回归分析的方法得到了一个局部敏感哈希图像检索参数优化的经验公式,使用该经验公式能够有效地减少计算步骤,降低算法参数优化的复杂度,提高算法运行效率。同时,本发明接近理论最优,能使算法获得较高的F1,从而获得优良的算法性能。

主权项:1.一种基于经验拟合的局部敏感哈希图像检索参数优化方法,其特征在于,包括如下步骤:S1、定义局部敏感哈希函数族H;所述定义局部敏感哈希函数族H,包括如下步骤:设任一图像都能表示为d维特征向量空间Rd中的一个点,所有图像构成d维特征向量数据集D,定义局部敏感哈希函数族H={h|D→U}为从数据集D到整数域U的映射, 其中,v∈D是任一图像的特征向量,a是d维正态分布随机向量,b为[0,w]上均匀分布的随机实数,w为表示映射区间大小的整数,所述v为高维向量,所述d100;S2、设k为局部敏感哈希函数的个数,L为哈希索引表的个数,r为查询范围,w为区间大小,当L,r,w的值确定时,计算出k值;所述k值的计算公式为: 其中,所述L的取值范围为[1,1000];S3、从H中取k个函数,定义k维局部敏感哈希函数族G;所述局部敏感哈希函数族G={g|D→Uk}为从数据集D到k维整数域U的映射,gv=h1v,…,hkv;S4、从G中取L个哈希函数,建立L张哈希索引表,包括如下步骤:从G中取L个哈希函数,glv∈G,l∈[1,L],对于所有v∈D,利用glv建立L张哈希索引表。

全文数据:基于经验拟合的局部敏感哈希图像检索参数优化方法技术领域[0001]本发明涉及一种参数优化方法,尤其涉及一种基于经验拟合的局部敏感哈希图像检索参数优化方法,属于图像处理领域。背景技术[0002]随着数据时代的到来,互联网上的图像、视频、音频等多媒体数据的处理量急剧增长。图像、视频等数据需提取的特征维度达到几百维甚至上千维,而这些高维数据往往呈现出非结构化特性,在处理高维数据时传统的数据处理方法不能满足要求,给相似性数据检索和语义分析等算法带来了巨大的困难。基于内容的图像检索方法,并不依赖于关键字来搜索,而通过提取图像的内容特征来进行图像匹配。其中基于图像特征的局部敏感哈希算法在处理高维数据时表现出了良好的性能,使其成为了近年来的研究热点。[0003]局部敏感哈希LocalitySensitiveHash算法作为最具代表性的哈希索引技术之一,是由Indyk和Motwani在1998年提出来的。其基本思想是对数据点集利用一组哈希函数建立多张哈希表,使得经过哈希映射后相似的点冲突的概率大,而不相似的点冲突的概率很小。自从算法提出以来,与其有关的各种哈希索引方法相继被提出。P稳定局部敏感哈希将空间距离计算由汉明空间转移到欧式空间;基于熵的局部敏感哈希在查询项的周围随机产生扰动对象作为查询项集合,这种算法是以时间为代价来减少空间的消耗;多探针局部敏感哈希通过大量实验结果指出几乎所有候选查询结果与查询对象在相同或者相邻的映射桶内,并据此提出有效的索引方案。[0004]局部敏感哈希的性能对几个参数非常敏感,而这些参数必须由算法实现时选择。算法中需要确定的参数有:区间大小w,哈希函数个数k,哈希表个数L,查询范围r。局部敏感哈希算法通过固定其中一个参数部分解决了这个问题。然而,算法的实现过程仍然留下了为其它参数寻找最优值的问题。算法中参数的调整过程既单调乏味又严重阻碍算法的应用,并且在目前的行业内,对于这些参数值的选取问题,缺乏系统性、规范性的指导。再加上局部敏感哈希函数参数选择的随机性,在单个局部敏感哈希函数的情况下,可能将不相近的数据点都映射成同一个哈希值,从而导致误差。[0005]综上所述,如何提出一种局部敏感哈希图像检索参数优化方法,保证算法的精确率及召回率,就成为了当下推荐算法的研究难点。发明内容[0006]鉴于现有技术存在上述缺陷,本发明的目的是提出一种基于经验拟合的局部敏感哈希图像检索参数优化方法。[0007]具体而言,一种基于经验拟合的局部敏感哈希图像检索参数优化方法,包括如下步骤:[0008]SI、定义局部敏感哈希函数族Η;[0009]S2、设k为局部敏感哈希函数的个数,L为哈希索引表的个数,当L,r,w的值确定时,计算出Ml;[0010]S3、从肿取k个函数,定义k维局部敏感哈希函数族G;[0011]S4、从G中取L个哈希函数,建立L张哈希索引表。[0012]优选地,Sl所述定义局部敏感哈希函数族H,包括如下步骤:[0013]设任一图像都能表示为d维特征向量空间¥中的一个点,所有图像构成d维特征向量数据集D,DciTi,定义局部敏感哈希函数族H={hID—U}为从数据集D到整数域U的映射,[0015]其中,是任一图像的特征向量,a是d维正态分布随机向量,b为[0,w]上均匀分布的随机实数,w为表示映射区间大小的整数。[0016]优选地,S2中所述1^值的计算公式为:[0018]优选地,S3中所述局部敏感哈希函数族G={g|D—Uk}为从数据集D到k维整数域U的映射,[0019]gv=hiv,...,hkv,[0020]其中,。[0021]优选地,S4所述从G中取L个哈希函数,建立L张哈希索引表,包括如下步骤:从G中取L个哈希函数,'^],对于所有veD,利用glv建立L张哈希索引表。[0022]优选地,所述L的取值范围为[1,1000]。[0023]优选地,所述wr。[0024]优选地,所述V为高维向量,所述d100。[0025]优选地,当L100且k13时,精确率和召回率的加权调和平均值Fl0.9。[0026]与现有技术相比,本发明的优点主要体现在以下几个方面:[0027]本发明通过回归分析的方法得到了一个局部敏感哈希图像检索参数优化的经验公式,使用该经验公式能够有效地减少计算步骤,降低算法参数优化的复杂度,提高算法运行效率。[0028]同时,本发明基于该经验公式的局部敏感哈希图像检索算法接近理论最优,能使算法获得较高的Fl,从而获得优良的算法性能。[0029]此外,本发明的方法也为同领域内的其他相关问题提供了参考,可以以此为依据进行拓展延伸,运用于领域内的其他算法、分析项目中,具有十分广阔的应用前景。[0030]综上所述,本发明提出了一种基于经验拟合的局部敏感哈希图像检索参数优化方法,具有很高的使用及推广价值。[0031]以下便结合实施例附图,对本发明的具体实施方式作进一步的详述,以使本发明技术方案更易于理解、掌握。附图说明[0032]图1是本发明方法对于局部敏感哈希图像检索的流程图。具体实施方式[0033]如图1所示,本发明揭示了一种基于经验拟合的局部敏感哈希图像检索参数优化方法。[0034]具体而言,一种基于经验拟合的局部敏感哈希图像检索参数优化方法,包括如下步骤:[0035]SI、定义局部敏感哈希函数族Η。[0036]S2、设k为局部敏感哈希函数的个数,L为哈希索引表的个数,当L,r,w的值确定时,计算出k值。在本实施例中,所述L的取值范围为[1,1000],且L取值越大,本发明的使用效果越好。所述wr。[0037]S3、从H中取k个函数,定义k维局部敏感哈希函数族G。[0038]S4、从G中取L个哈希函数,建立L张哈希索引表。[0039]Sl所述定义局部敏感哈希函数族H,包括如下步骤:[0040]设任一图像都能表示为d维特征向量空间¥中的一个点,所有图像构成d维特征向量数据集D,DC=#,定义局部敏感哈希函数族H={hID—U}为从数据集D到整数域U的映射,[0042]其中,vGD是任一图像的特征向量,a是d维正态分布随机向量,b为[0,w]上均匀分布的随机实数,w为表示映射区间大小的整数。所述特征向量V为高维向量,所述维度d100。[0043]S2中所述k值的计算公式为:[0045]S3中所述局部敏感哈希函数族G={gID—Uk}为从数据集D到k维整数域U的映射,[0046]gV=hiV,···,hkV,[0047]其中,hi,,^.^[0048]S4所述从G中取L个哈希函数,建立L张哈希索引表,包括如下步骤:从G中取L个哈希函数,giveG,le[l,L],对于所有veD,利用giv建立L张哈希索引表。[0049]需要说明的是,在本实施例中,当w=5,r=2,L100且k13时,使用本发明算法的精确率和召回率的加权调和平均值F10.9。[0050]为了验证本发明的消息转发方法能够有效实现减少副本开销,特列举一验证例进行说明。[0051]本验证例中,假设哈希索引表个数L=100,映射区间大小w=5,查询范围r=2,为了使该查询的精确率和召回率的调和平均Fl取得最大值,局部敏感哈希函数个数k的值由以下经验公式计算:一一,[0053]然后利用k,L按照S3和S4中的方法选取哈希函数,建立图像的哈希索引。理论分析和实验验证表明,当k=13,L=100,w=5,r=2时可得Fl=0.918。[0054]上述结论可以证明,本发明的基于经验拟合的局部敏感哈希图像检索参数优化方法,通过加入经验公式快速的计算出算法里涉及的参数,使得算法参数优化的复杂度降低很多,提高了实验的运行效率。该方法算出的参数运用在局部敏感哈希图像检索里,与理论最优非常接近,不仅减少了确定参数的时间,还可以获得较高的F1。从而获得优良的算法性能。[0055]此外,本发明的方法也为同领域内的其他相关问题提供了参考,可以以此为依据进行拓展延伸,运用于领域内的其他算法、分析项目中,具有十分广阔的应用前景。[0056]对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神和基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。[0057]此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

权利要求:1.一种基于经验拟合的局部敏感哈希图像检索参数优化方法,其特征在于,包括如下步骤:51、定义局部敏感哈希函数族Η;52、设k为局部敏感哈希函数的个数,L为哈希索引表的个数,当L,r,w的值确定时,计算出Mt;53、从H中取k个函数,定义k维局部敏感哈希函数族G;54、从G中取L个哈希函数,建立L张哈希索引表。2.根据权利要求1所述基于经验拟合的局部敏感哈希图像检索参数优化方法,其特征在于,Sl所述定义局部敏感哈希函数族H,包括如下步骤:设任一图像都能表示为d维特征向量空间Rd中的一个点,所有图像构成d维特征向量数据集D,,定义局部敏感哈希函数族H={hID—U}为从数据集D到整数域U的映射,其中,VeD是任一图像的特征向量,a是d维正态分布随机向量,b为[0,w]上均匀分布的随机实数,w为表示映射区间大小的整数。3.根据权利要求1所述基于经验拟合的局部敏感哈希图像检索参数优化方法,其特征在于,S2中所述k值的计算公式为:4.根据权利要求1所述基于经验拟合的局部敏感哈希图像检索参数优化方法,其特征在于:S3中所述局部敏感哈希函数族G={g|D—Uk}为从数据集D到k维整数域U的映射,gV=hiV,···,hkV,其中,]^£!1,1£[1,1〇。5.根据权利要求1所述基于经验拟合的局部敏感哈希图像检索参数优化方法,其特征在于,S4所述从G中取L个哈希函数,建立L张哈希索引表,包括如下步骤:从G中取L个哈希函数,giveG,le[1,L],对于所有vGD,利用giv建立L张哈希索引表。6.根据权利要求1所述基于经验拟合的局部敏感哈希图像检索参数优化方法,其特征在于:所述L的取值范围为[1,1000]。7.根据权利要求1所述基于经验拟合的局部敏感哈希图像检索参数优化方法,其特征在于:所述wr。8.根据权利要求2所述基于经验拟合的局部敏感哈希图像检索参数优化方法,其特征在于:所述V为高维向量,所述d100。9.根据权利要求1所述基于经验拟合的局部敏感哈希图像检索参数优化方法,其特征在于:当L100且k13时,精确率和召回率的加权调和平均值Fl0.9。

百度查询: 南京邮电大学 基于经验拟合的局部敏感哈希图像检索参数优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。