买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】迁移路径生成方法、装置及存储介质_腾讯音乐娱乐科技(深圳)有限公司_201811400866.6 

申请/专利权人:腾讯音乐娱乐科技(深圳)有限公司

申请日:2018-11-22

公开(公告)日:2023-01-13

公开(公告)号:CN109635153B

主分类号:G06F16/635

分类号:G06F16/635;G06F16/65

优先权:

专利状态码:有效-授权

法律状态:2023.01.13#授权;2019.05.10#实质审查的生效;2019.04.16#公开

摘要:本发明实施例公开了一种迁移路径生成方法、装置及存储介质,属于计算机技术领域。该方法包括:将在指定维度上的信息相同的对象划分为同一类别,得到多个类别,每个类别中包括至少一个对象;分别对每个类别的对象的详情信息进行特征提取,得到多个类别的特征向量,进而确定每个类别在多个类别中的相似类别;根据多个类别以及每个类别的相似类别,创建相关性网络;根据相关性网络,确定从起点类别到达终点类别所经过的迁移路径,起点类别和终点类别为多个类别中的任两个类别。为后续的功能扩展提供了信息基础,无需人工设置标签,避免了浪费人工资源,降低了人力成本,且避免了由于设置的标签主观性较强导致准确度较低的问题,提高了准确度。

主权项:1.一种迁移路径生成方法,其特征在于,所述方法包括:将在指定维度上的信息相同的对象划分为同一类别,得到多个类别,每个类别中包括至少一个对象,且所述每个类别的标识用所述至少一个对象在所述指定维度上的信息表示;分别对所述每个类别的对象的详情信息进行特征提取,得到所述多个类别的特征向量,根据所述多个类别的特征向量,确定所述每个类别在所述多个类别中的相似类别,任一类别与相似类别之间的相似度大于与非相似类别之间的相似度;根据所述多个类别以及所述每个类别的相似类别,创建相关性网络,所述相关性网络包含所述多个类别,且所述每个类别与对应的相似类别关联;根据所述相关性网络,确定从起点类别到达终点类别所经过的迁移路径,所述起点类别和所述终点类别为所述多个类别中的任两个类别。

全文数据:迁移路径生成方法、装置及存储介质技术领域本发明实施例涉及计算机技术领域,特别涉及一种迁移路径生成方法、装置及存储介质。背景技术收听歌曲是人们丰富精神生活的一种常用途径,用户经常会收听自己喜欢的歌手演唱的歌曲,而随着时间的推移,用户喜欢的歌手可能会发生变化。相关技术中,可以人工为每个歌手设置多个标签,该多个标签可以为性别标签、年代标签、语种标签等。根据每个歌手的多个标签进行类别划分,得到多个类别,其中每个类别包括至少一个歌手。获取多个用户的播放记录,每个用户的播放记录中包括用户播放过的歌曲、演唱该歌曲的歌手以及该歌曲的播放情况等数据,根据每个用户的播放记录以及播放记录中的歌手所属的类别,可以确定每个用户的类别,该类别是指用户喜欢的歌手所属的类别,进而可以得到每个类别的用户群体。上述方式需要人工为每个歌手设置标签,耗费了较高的人力成本,而且所设置的标签主观性较强,导致准确度较低。发明内容本发明实施例提供了一种迁移路径生成方法、装置及存储介质,可以解决相关技术存在的问题。所述技术方案如下:一方面,提供了一种迁移路径生成方法,所述方法包括:将在指定维度上的信息相同的对象划分为同一类别,得到多个类别,每个类别中包括至少一个对象,且所述每个类别的标识用所述至少一个对象在所述指定维度上的信息表示;分别对所述每个类别的对象的详情信息进行特征提取,得到所述多个类别的特征向量,根据所述多个类别的特征向量,确定所述每个类别在所述多个类别中的相似类别,任一类别与相似类别之间的相似度大于与非相似类别之间的相似度;根据所述多个类别以及所述每个类别的相似类别,创建相关性网络,所述相关性网络包含所述多个类别,且所述每个类别与对应的相似类别关联;根据所述相关性网络,确定从起点类别到达终点类别所经过的迁移路径,所述起点类别和所述终点类别为所述多个类别中的任两个类别。另一方面,提供了一种迁移路径生成装置,所述装置包括:划分模块,用于将在指定维度上的信息相同的对象划分为同一类别,得到多个类别,每个类别中包括至少一个对象,且所述每个类别的标识用所述至少一个对象在所述指定维度上的信息表示;特征提取模块,用于分别对所述每个类别的对象的详情信息进行特征提取,得到所述多个类别的特征向量,所述每个类别中包括至少一个对象;相似类别确定模块,用于根据所述多个类别的特征向量,确定所述每个类别在所述多个类别中的相似类别,任一类别与相似类别之间的相似度大于与非相似类别之间的相似度;创建模块,用于根据所述多个类别以及所述每个类别的相似类别,创建相关性网络,所述相关性网络包含所述多个类别,且所述每个类别与对应的相似类别关联;迁移路径确定模块,用于根据所述相关性网络,确定从起点类别到达终点类别所经过的迁移路径,所述起点类别和所述终点类别为所述多个类别中的任两个类别。另一方面,提供了迁移路径生成的装置,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如所述迁移路径生成方法中所具有的操作。再一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并具有以实现如所述迁移路径生成方法中所具有的操作。本发明实施例提供的方法、装置及存储介质,通过对每个类别的至少一个对象的详情信息进行特征提取,得到多个类别的特征向量,根据特征向量得到每个类别的相似类别,将每个类别与其相似类别关联,创建相关性网络,根据相关性网络能够得到多个类别中任两个类别的迁移路径,而不仅是计算任两个类别之间的迁移概率,该迁移路径可以表示在这两个类别之间进行迁移时经过的其他类别,模拟出两个或两个以上类别之间逐步迁移的过程,为任两个非相似类别之间的迁移提供了用于过渡的其他类别,提高了信息量,为后续的功能扩展提供了信息基础。并且,无需人工设置标签,避免了浪费人工资源,降低了人力成本,且避免了由于设置的标签主观性较强导致准确度较低的问题,提高了迁移路径的准确度。并且,在获取相似类别的过程中,根据每个类别的多维特征向量创建多维空间,并根据每个类别在该多维空间中的位置将该多维空间划分为多个区域,以得到每个类别的相似类别,确定相似类别的过程中采用了每个类别在多个维度上的特征值,采用的信息更为全面,提高了相似类别的准确度。并且,创建多维空间,在多维空间中进行区域划分后在所属区域和相邻区域内查找相似类别,减小了计算量,加快了计算速度。并且,从多条迁移路径中选取包含的类别个数最少的迁移路径,或者从多条迁移路径中选取迁移距离最小的迁移路径,尽可能地找到起点类别与终点类别之间的最短迁移路径,即找到从起点类别到终点类别迁移时经过的最少过渡类别,分析出起点类别与终点类别之间的最快迁移方式。并且,以迁移路径作为基础,可以将该迁移路径应用于推荐对象或者对推荐的对象进行反向分析的场景,能够为用户推荐合理的对象,还能及时排查出推荐不合理的情形,提高推荐准确度,扩大了应用范围,扩展了更多的功能。附图说明为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明实施例提供的一种迁移路径生成方法的流程图;图2是本发明实施例提供的一种多维空间的划分示意图;图3是本发明实施例提供的一种二叉树示意图;图4是本发明实施例提供的一种相关性网络的示意图;图5是本发明实施例提供的一种邻接表的结构示意图;图6是本发明实施例提供的一种迁移路径的显示界面示意图;图7是本发明实施例提供的一种迁移路径生成装置的结构示意图;图8是本发明实施例提供的一种终端的结构示意图;图9是本发明实施例提供的一种服务器的结构示意图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。在对本发明实施例进行详细说明之前,首先对涉及到的概念进行如下解释:1、对象:可作为独立个体存在的数据,从数据格式上来说,对象可以包括音频数据、视频数据、网页数据、图片数据等多种格式的数据,如歌曲、电影等。每个对象具有详情信息,该详情信息包括多个维度上的信息,如歌曲包括歌手、时长、演唱语言、发行时间等详情信息,电影包括导演、时长、语言、发行时间等详情信息。2、类别:是指按照指定维度上的信息相同与否,对多个对象进行划分得到的类别,其中每个类别中包括在指定维度上的信息相同的至少一个对象,且每个类别采用在指定维度上的信息来表示。如可以按照歌手的不同,将多个歌曲划分为多个类别,每个类别的歌曲的歌手相同,且类别名称即为歌曲的名字。或者,可以按照导演的不同,将多个电影划分为多个类别,每个类别的电影的导演相同,且类别名称即为导演的名字。相关技术中,可以人工为每个歌手设置多个标签,该多个标签用于描述每个歌手,根据每个歌手的多个标签进行类别划分,得到多个类别,其中每个类别包括至少一个歌手。获取多个用户的播放记录,根据每个用户的播放记录确定每个用户的类别。根据多个用户在多个时间段内的播放记录进行统计,得到每个类别在多个时间段内的用户群体,将每个类别在不同时间段内的用户群体进行对比,得到任两个类别之间的迁移概率。该方式需要人工为每个歌手设置标签,耗费了较高的人力成本,而且所设置的标签主观性较强,导致确定的迁移概率的准确度较低。而本发明实施例提供了一种迁移路径生成方法,通过对同一类别的至少一个对象的详情信息进行特征提取,得到多个类别的特征向量,根据特征向量得到每个类别的相似类别,将每个类别与其相似类别关联,创建相关性网络,进而得到多个类别中任两个类别的迁移路径,该迁移路径可以表示在这两个类别之间进行迁移时经过的其他类别,模拟出两个或两个以上类别之间逐步迁移的过程,提高了信息量。并且,无需人工设置标签,避免了浪费人工资源,降低了人力成本,且避免了由于设置的标签主观性较强导致准确度较低的问题,提高了迁移路径的准确度。本发明实施例可以应用于获取任两个类别之间的迁移路径的场景下。例如,将互联网中的大量歌曲作为对象,按照演唱歌曲的歌手进行划分得到对象所属的类别,每个类别采用歌手来表示,则采用本发明实施例提供的方法,创建包含多个歌手的相关性网络,根据该相关性网络可以确定任两个歌手之间的迁移路径,该迁移路径代表了多个歌手之间的风格转变过程。进一步地,根据任两个歌手之间的迁移路径,以及用户当前喜欢歌曲的歌手,可以为用户推荐其他歌手。例如,获取该用户经常收听的多个歌手,根据该多个歌手中任两个歌手之间的迁移路径,可以为该用户推荐该迁移路径中包括的其他歌手的歌曲。或者,将互联网中的大量电影作为对象,按照制作电影的导演进行划分得到对象所属的类别,每个类别采用导演来表示,则采用本发明实施例提供的方法,创建包含多个导演的相关性网络,根据该相关性网络可以确定任两个导演之间的迁移路径,该迁移路径代表了多个导演之间的风格转变路径。进一步地,根据任两个导演之间的迁移路径,以及用户当前喜欢电影的导演,可以为用户推荐其他导演。例如,获取该用户经常观看的多个电影的导演,根据该多个导演中任两个导演之间的迁移路径,可以为该用户推荐该迁移路径中包括的其他导演的电影。或者,将互联网中的大量商品作为对象,按照商品所属的商品类型进行划分得到对象所属的类别,每个类别采用商品类型来表示,则采用本发明实施例提供的方法,创建包含多个商品类型的相关性网络,根据该相关性网络可以确定任两个商品类型之间的迁移路径,该迁移路径代表了多个商品类型之间的转变路径。进一步地,根据任两个商品类型之间的迁移路径,以及用户当前经常购买商品类型,可以为用户推荐其他类型的商品。例如,获取该用户经常购买的多个商品类型,根据该多个商品类型中任两个商品类型之间的迁移路径,可以为该用户推荐该迁移路径中包括的其他商品类型的商品。图1是本发明实施例提供的一种迁移路径生成方法的流程图。本发明实施例的执行主体为生成装置,参见图1,该方法包括:101、生成装置将在指定维度上的信息相同的对象划分为同一类别,得到多个类别,分别对每个类别的对象的详情信息进行特征提取,得到多个类别的特征向量。该生成装置可以是终端或者服务器。当生成装置是服务器时,服务器可以收集多个终端访问的多个对象以及该多个对象的详情信息,或者收集多个发布者上传的多个对象以及该多个对象的详情信息,由服务器将收集到的对象及其详情信息进行存储,并对存储的详情信息进行划分和统计,得到多个类别的特征向量。或者,当生成装置是终端时,终端接收服务器发送的多个对象以及该多个对象的详情信息,将该多个对象以及该多个对象的详情信息进行存储,并对存储的详情信息进行划分和统计,得到多个类别的特征向量。本发明实施例中,多个对象中每个对象都具有详情信息,每个对象的详情信息包括多个维度的信息,用于从多个维度来描述相应的对象。根据每个对象的详情信息在指定维度上的信息,可以将该多个对象划分为不同类别,得到多个类别,其中每个类别中包括在指定维度上的信息相同的至少一个对象,且每个类别的标识用该至少一个对象在指定维度上的信息表示。该指定维度为该多个维度中的任一维度,可以根据用户的需求确定,也可以按照每个维度上的信息在互联网中的热门程度,将用户最为关注的维度确定为指定维度。例如,当对象为歌曲时,每个歌曲的详情信息可以包括歌手、时长、演唱语言、发行时间等详情信息。针对该多个歌曲,若按照歌手来划分,可以得到多个类别,每个类别采用一个歌手来表示,每个类别的至少一个对象表征由该歌手演唱的至少一个歌曲。或者,当多个对象为多个商品时,每个商品的详情信息可以包括该商品的颜色、价格、型号、生产厂家以及商品类型等信息。针对该多个商品,若按照商品类型来划分,可以得到多个类别,每个类别表征一种商品类型,每个类别的至少一个对象表征属于每种商品类型的至少一个商品。生成装置获取每个对象的详情信息,并对该每个对象的详情信息进行特征提取,得到每个对象的特征向量,该每个对象的特征向量用于描述该每个对象的特征。由于同一类别包括至少一个对象,因此生成装置分别对属于同一类别的至少一个对象的特征向量进行统计,得到多个类别中每个类别的特征向量。在一种可能的实现方式中,生成装置也可以获取每个类别的至少一个对象的详情信息,并得到每个对象的详情信息中包含的至少一个词组,对于每个词组,可以采用预设转换算法进行词语到词向量的转换,得到该词组对应的词向量,从而得到至少一个词组对应的至少一个词向量,将该至少一个词向量组合构成对象的特征向量。其中,该预设转换算法可以为word2vec词语转换向量算法或其他算法。在另一种可能的实现方式中,生成装置获取到任一类别的至少一个对象的特征向量后,将该至少一个对象的特征向量进行均值计算,将均值计算后得到的向量作为该类别的特征向量。按照相同的计算方式分别对每个类别进行计算,得到每个类别的特征向量。102、生成装置根据多个类别的特征向量,计算任两个类别之间的相似度。本发明实施例中,生成装置获取到多个类别的特征向量后,根据多个类别的特征向量,将每个类别的特征向量分别与除了该类别之外的其他类别的特征向量进行对比,可以得到任两个类别之间的相似度,进而根据得到的相似度,确定每个类别的相似类别。其中,任两个类别之间的相似度代表任两个类别之间的相似程度,相似度越高,这两个类别越相似,相似度越低,这两个类别越不相似。在一种可能的实现方式中,生成装置获取到多个类别的特征向量以后,将每个类别的特征向量,分别与其他类别的特征向量进行点乘计算,得到每个类别与其他类别之间的相似度,进而得到多个类别中任两个类别之间的相似度。除进行点乘计算的方式之外,还可以采用计算欧式距离、计算余弦相似度等方式,计算任两个类别之间的相似度。103、对于每个类别,生成装置根据该类别与多个类别中除了该类别之外的其他类别之间的相似度,确定该类别在多个类别中的相似类别。其中,任一类别与相似类别之间的相似度大于与非相似类别之间的相似度。为了确定各个类别之间的相似程度,对于每个类别,可以根据该类别与其他类别之间的相似度,将这些其他类别划分为该类别的相似类别和非相似类别。其中,该类别与相似类别之间的相似度大于该类别与非相似类别之间的相似度。在一种可能实现方式中,每个对象的详情信息包括该对象在多个维度上的信息,每个类别的特征向量也包括该类别在多个维度上的特征值,则可以综合考虑每个类别在多个维度上的特征值,来确定每个类别的相似类别。为此,如图2所示,生成装置根据该多个维度创建多维空间,根据每个类别的特征向量在多个维度中每个维度上的特征值,确定该每个类别在该多维空间中的位置,根据多个类别在该多维空间中的位置,将该多维空间划分为多个区域,每个区域中包含至少一个类别。对于每个类别,将该类别所属区域以及所属区域的相邻区域作为该类别的备选区域,分别获取该类别与备选区域中除该类别之外的其他类别之间的相似度,从而确定该类别在备选区域中的相似类别。例如,生成装置可以采用预设划分算法对多维空间进行区域划分。其中,该预设划分算法可以为KD树一种分割k维数据空间的数据结构算法或其他算法。如图2和图3所示,KD树算法根据多维空间构建一个二叉树,二叉树上的一个节点代表多维空间中的一个区域,每次对多维空间的任一区域进行划分时,会为该区域在二叉树上对应的节点生成子节点,直至多维空间的区域划分完成时,二叉树上的每个叶子节点可以代表一个最小单位的区域,为每个叶子节点添加一个标签,该标签可以代表对应区域内类别的数量。采用KD树算法可以实现快速划分,加快划分速度,进而加快了确定相似类别的速度。在一种可能的实现方式中,针对每个类别,根据该类别与其他类别之间的相似度,将备选区域中与类别之间的相似度最大的类别作为该类别的相似类别。在另一种可能的实现方式中,针对每个类别,根据该类别与其他类别之间的相似度,将这些其他类别按照与该类别之间的相似度从大到小的顺序排列,并按照排列顺序从中选取预设数量的类别,作为相似类别。在另一种可能实现方式中,获取该类别与其他类别之间的相似度,将其他类别按照与该类别之间的相似度从大到小的顺序之后,可以创建该类别的相似度列表,该相似度列表中包含按照顺序排列的其他类别。则可以根据该相似度列表,选取第一个类别作为该类别的相似类别,或者,按照顺序选取预设数量的类别作为该类别的相似类别。当然,生成装置还可以采用其他方式确定每个类别的相似类别。104、生成装置根据多个类别以及每个类别的相似类别,创建相关性网络。生成装置获取到每个类别的相似类别,并将每个类别与该类别的相似类别进行关联,创建相关性网络,则该相关性网络包含该多个类别,且每个类别均与该类别的相似类别关联,该相关性网络可以如图4所示。在一种可能的实现方式中,在获取到上述相关性网络之后,可以采用Protobuf一种数据交换的格式创建邻接表,以邻接表的结构将该相关性网络存储为图形网络,根据该图形网络可以直观地看出各个类别之间的相关程度。其中,邻接表中存储了每个类别的至少一个相似类别,且该至少一个相似类别按照顺序排列。例如,该邻接表可以如图5所示,类别A按照顺序排列的相似类别分别为类别B和类别D,类别B按照顺序排列的相似类别分别为类别A、类别C和类别D,类别C的相似类别为类别B,类别D按照顺序排列的相似类别分别为类别A和类别B。105、生成装置根据相关性网络,确定从起点类别到达终点类别所经过的迁移路径。其中,上述起点类别和终点类别为多个类别中的任两个类别,迁移路径上至少包括起点类别和终点类别这两个类别,当然还可以包括除起点类别和终点类别以外的其他类别。可选地,生成装置在确定起点类别和终点类别后,可以采用预设算法计算起点类别到达终点类别所经过的迁移路径,其中,该预设算法可以为Dijkstra迪杰斯特拉算法或其他算法,其中Dijkstra是一种单源最短路径算法,用于计算一个节点到其他所有节点的最短路径。在一种可能的实现方式中,生成装置可以在起点类别采用Dijkstra算法进行查找,直至查找到终点类别为止,此时迁移路径查找结束,生成装置获取该从起点类别到终点类别的迁移路径并保存。在另一种可能的实现方式中,生成装置可以在终点类别采用Dijkstra算法进行查找,直至查找到起点类别为止,此时迁移路径查找结束,生成装置获取该从起点类别到终点类别的迁移路径并保存。在另一种可能的实现方式中,生成装置可以在起点类别和终点类别同时采用Dijkstra算法进行查找,直至从该起点类别和该终点类别进行的查找在某一中间类别相遇,此时迁移路径查找结束,生成装置获取从该起点类别到该中间类别之间的迁移路径以及该中间类别到该终点类别的迁移路径,并将该两个迁移路径共同构成的迁移路径保存为从该起点类别到该终点类别的迁移路径。如果在相关性网络中确定了从起点类别到达终点类别所经过的多条迁移路径,则从多条迁移路径中选取任一条迁移路径。在一种可能的实现方式中,从上述多条迁移路径中选取包含的类别个数最少的迁移路径。或者,从上述多条迁移路径中选取迁移距离最小的迁移路径。其中,任两个类别之间的迁移距离与任两个类别之间的相似度呈负相关关系,即相似度越高,迁移距离越短。例如,当类别为歌手时,从起点类别到达终点类别所经过的迁移路径即为多个歌手中任两个歌手之间的迁移路径,如图6所示,迁移路径显示界面上显示有用于搜索起点类别和终点类别的搜索栏,以及“搜索”按钮,用户可以分别在两个搜索栏中输入起点类别和终点类别,然后点击“搜索”按钮即可显示从起点类别到终点类别之间的迁移路径。若起点类别为歌手A,终点类别为歌手F,则在起点类别和终点类别同时运行Dijkstra算法进行查找,得到了“歌手A→歌手B→歌手C→歌手D→歌手E→歌手F”的迁移路径,则该迁移路径即为从歌手A到歌手F的迁移路径。本发明实施例可以应用于为用户展示迁移路径的场景下,用户可以在生成装置上设置起点类别和终点类别,由生成装置生成从起点类别到达终点类别所经过的迁移路径后,展示给用户,用户即可得知起点类别与终点类别之间的迁移过程,以及迁移过程中涉及到的其他类别,提供了一种新型的展示方式,增强了趣味性。例如,当对象为歌曲,类别为歌手时,用户随意设置两个风格差异很大的歌手A和B,则可以生成歌手A与歌手B之间的迁移路径,用户即可获知歌手A与歌手B之间存在的其他歌手,了解歌手A到歌手B的风格演变过程。另外,本发明实施例还可以应用于为用户推荐对象的场景下,在确定从起点类别到终点类别所经过的迁移路径后,还可以根据该迁移路径建立待推荐对象的列表,并将该列表推荐给用户。其中,该推荐列表除了包含有起点类别和终点类别中的对象之外,还包含有该迁移路径上起点类别和终点类别之间的其他类别中的至少一个对象。例如,当对象为歌曲,类别为歌手时,根据用户当前喜欢的多个歌手,可以为用户推荐该多个歌手中,任两个歌手的迁移路径上的其他歌手所演唱的歌曲。或者,当对象为电影,类别为导演时,根据用户当前喜欢的多个导演,可以为用户推荐该多个导演中,任两个导演的迁移路径上的其他导演所制作的电影。或者,当对象为商品,类别为商品类型时,根据用户当前经常购买的商品类型,可以为用户推荐该多个商品类型中,任两个商品类型的迁移路径上的其他商品类型所包含的商品。另外,本发明实施例还可以应用于对推荐的对象进行反向分析的场景下,采用一些推荐算法为用户推荐了对象之后,可以采用本发明实施例提供的方法,获取从推荐的对象所属的类别到用户喜欢的某一类别之间的迁移路径,根据该迁移路径的迁移距离,可以分析出所推荐的对象是否合理,是否满足用户的喜好,能够及时排查出推荐错误的情形,从而实现了反向分析。例如,当对象为歌曲,类别为歌手时,当为用户推荐了某一歌曲时,根据用户当前喜欢的歌手与演唱该推荐歌曲的歌手之间的迁移路径,可以判断推荐的歌手是否合理。本发明实施例提供的方法,通过对每个类别的至少一个对象的详情信息进行特征提取,得到多个类别的特征向量,根据特征向量得到每个类别的相似类别,将每个类别与其相似类别进行关联,创建相关性网络,根据相关性网络能够得到多个类别中任两个类别的迁移路径,而不仅是计算任两个类别之间的迁移概率,该迁移路径可以表示在这两个类别之间进行迁移时经过的其他类别,模拟出两个或两个以上类别之间逐步迁移的过程,为任两个非相似类别之间的迁移提供了用于过渡的其他类别,提高了信息量,为后续的功能扩展提供了信息基础。并且,无需人工设置标签,避免了浪费人工资源,降低了人力成本,且避免了由于设置的标签主观性较强导致准确度较低的问题,提高了迁移路径的准确度。并且,在获取相似类别的过程中,根据每个类别的多维特征向量创建多维空间,并根据每个类别在该多维空间中的位置将该多维空间划分为多个区域,以得到每个类别的相似类别,确定相似类别的过程中采用了每个类别在多个维度上的特征值,采用的信息更为全面,提高了相似类别的准确度。并且,创建多维空间,在多维空间中进行区域划分后在所属区域和相邻区域内查找相似类别,减小了计算量,加快了计算速度。并且,从多条迁移路径中选取包含的类别个数最少的迁移路径,或者从多条迁移路径中选取迁移距离最小的迁移路径,尽可能地找到起点类别与终点类别之间的最短迁移路径,即找到从起点类别到终点类别迁移时经过的最少过渡类别,分析出起点类别与终点类别之间的最快迁移方式。并且,以迁移路径作为基础,可以将该迁移路径应用于推荐对象或者对推荐的对象进行反向分析的场景,能够为用户推荐合理的对象,还能及时排查出推荐不合理的情形,提高推荐准确度,扩大了应用范围,扩展了更多的功能。图7是本发明实施例提供的一种迁移路径生成装置的结构示意图,参见图7,该装置包括:划分模块701,用于执行上述实施例中将在指定维度上的信息相同的对象划分为同一类别,得到多个类别的步骤;特征提取模块702,用于执行上述实施例中分别对每个类别的对象的详情信息进行特征提取,得到多个类别的特征向量的步骤;相似类别确定模块703,用于执行上述实施例中根据多个类别的特征向量,确定每个类别在多个类别中的相似类别的步骤;创建模块704,用于执行上述实施例中根据多个类别以及每个类别的相似类别,创建相关性网络的步骤;迁移路径确定模块705,用于执行上述实施例中根据相关性网络,确定从起点类别到达终点类别所经过的迁移路径的步骤。可选地,特征提取模块702,包括:特征提取单元,用于执行上述实施例中对每个对象的详情信息进行特征提取,得到每个对象的特征向量的步骤;统计单元,用于执行上述实施例中分别对每个类别的至少一个对象的特征向量进行统计,得到多个类别的特征向量的步骤。可选地,相似类别确定模块703,包括:计算单元,用于执行上述实施例中根据多个类别的特征向量,计算任两个类别之间的相似度的步骤;相似类别确定单元,用于执行上述实施例中对于每个类别,根据类别与多个类别中除类别之外的其他类别之间的相似度,确定类别在多个类别中的相似类别的步骤。可选地,对象的详情信息包括对象在多个维度上的信息,则类别的特征向量包括类别在多个维度上的特征值;相似类别确定单元用于执行上述实施例中根据多个维度创建多维空间,基于该多维空间确定类别在备选区域中的相似类别的步骤。可选地,相似类别确定单元还用于执行上述实施例中根据类别与备选区域中每个类别之间的相似度,将备选区域中与类别之间的相似度最大的类别作为相似类别;或者,按照与类别之间的相似度从大到小的顺序,从备选区域中选取预设数量的类别,作为相似类别的步骤;可选地,迁移路径确定模块705,包括:迁移路径确定单元,用于执行上述实施例中根据相关性网络,确定从起点类别到达终点类别所经过的多条迁移路径的步骤;选取单元,用于执行上述实施例中从多条迁移路径中选取包含的类别个数最少的迁移路径;或者,从多条迁移路径中选取迁移距离最小的迁移路径,任两个类别之间的迁移距离与任两个类别之间的相似度呈负相关关系的步骤。需要说明的是:上述实施例提供的迁移路径生成装置在生成迁移路径时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将生成装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的迁移路径生成装置与迁移路径生成方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。图8示出了本发明一个示例性实施例提供的终端800的结构示意图。该终端800可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3、MP4MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4播放器、笔记本电脑、台式电脑、头戴式设备,或其他任意智能终端。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。通常,终端800包括有:处理器801和存储器802。处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSPDigitalSignalProcessing,数字信号处理、FPGAField-ProgrammableGateArray,现场可编程门阵列、PLAProgrammableLogicArray,可编程逻辑阵列中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPUCentralProcessingUnit,中央处理器;协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以在集成有GPUGraphicsProcessingUnit,图像处理器,GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括AIArtificialIntelligence,人工智能处理器,该AI处理器用于处理有关机器学习的计算操作。存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所具有以实现本申请中方法实施例提供的迁移路径生成方法。在一些实施例中,终端800还可选包括有:外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地,外围设备包括:射频电路804、触摸显示屏805、摄像头806、音频电路807、定位组件808和电源809中的至少一种。外围设备接口803可被用于将IOInputOutput,输入输出相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。射频电路804用于接收和发射RFRadioFrequency,射频信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路804包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络2G、3G、4G及8G、无线局域网和或WiFiWirelessFidelity,无线保真网络。在一些实施例中,射频电路804还可以包括NFCNearFieldCommunication,近距离无线通信有关的电路,本申请对此不加以限定。显示屏805用于显示UIUserInterface,用户界面。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和或虚拟键盘,也称软按钮和或软键盘。在一些实施例中,显示屏805可以为一个,设置终端800的前面板;在另一些实施例中,显示屏805可以为至少两个,分别设置在终端800的不同表面或呈折叠设计;在再一些实施例中,显示屏805可以是柔性显示屏,设置在终端800的弯曲表面上或折叠面上。甚至,显示屏805还可以设置成非矩形的不规则图形,也即异形屏。显示屏805可以采用LCDLiquidCrystalDisplay,液晶显示屏、OLEDOrganicLight-EmittingDiode,有机发光二极管等材质制备。摄像头组件806用于采集图像或视频。可选地,摄像头组件806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VRVirtualReality,虚拟现实拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路807还可以包括耳机插孔。定位组件808用于定位终端800的当前地理位置,以实现导航或LBSLocationBasedService,基于位置的服务。定位组件808可以是基于美国的GPSGlobalPositioningSystem,全球定位系统、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。在一些实施例中,终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于:加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号,控制触摸显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。陀螺仪传感器812可以检测终端800的机体方向及转动角度,陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3D动作。处理器801根据陀螺仪传感器812采集的数据,可以实现如下功能:动作感应比如根据用户的倾斜操作来改变UI、拍摄时的图像稳定、游戏控制以及惯性导航。压力传感器813可以设置在终端800的侧边框和或触摸显示屏805的下层。当压力传感器813设置在终端800的侧边框时,可以检测用户对终端800的握持信号,由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在触摸显示屏805的下层时,由处理器801根据用户对触摸显示屏805的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。指纹传感器814用于采集用户的指纹,由处理器801根据指纹传感器814采集到的指纹识别用户的身份,或者,由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器801授权该用户具有相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置终端800的正面、背面或侧面。当终端800上设置有物理按键或厂商Logo时,指纹传感器814可以与物理按键或厂商标志集成在一起。光学传感器815用于采集环境光强度。在一个实施例中,处理器801可以根据光学传感器815采集的环境光强度,控制触摸显示屏805的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏805的显示亮度;当环境光强度较低时,调低触摸显示屏805的显示亮度。在另一个实施例中,处理器801还可以根据光学传感器815采集的环境光强度,动态调整摄像头组件806的拍摄参数。接近传感器816,也称距离传感器,通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中,当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时,由处理器801控制触摸显示屏805从亮屏状态切换为息屏状态;当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时,由处理器801控制触摸显示屏805从息屏状态切换为亮屏状态。本领域技术人员可以理解,图8中示出的结构并不构成对终端800的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。图9是本发明实施例提供的一种服务器的结构示意图,该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器centralprocessingunits,CPU901和一个或一个以上的存储器902,其中,所述存储器902中存储有至少一条指令,所述至少一条指令由所述处理器901加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。服务器900可以用于执行上述迁移路径生成方法中生成装置所执行的步骤。本发明实施例还提供了一种迁移路径生成装置,该装置包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,指令、程序、代码集或指令集由处理器加载并具有以实现上述实施例的迁移路径生成方法中所具有的操作。本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该指令、该程序、该代码集或该指令集由处理器加载并具有以实现上述实施例的迁移路径生成方法中所具有的操作。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。以上所述仅为本发明实施例的较佳实施例,并不用以限制本发明实施例,凡在本发明实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

权利要求:1.一种迁移路径生成方法,其特征在于,所述方法包括:将在指定维度上的信息相同的对象划分为同一类别,得到多个类别,每个类别中包括至少一个对象,且所述每个类别的标识用所述至少一个对象在所述指定维度上的信息表示;分别对所述每个类别的对象的详情信息进行特征提取,得到所述多个类别的特征向量,根据所述多个类别的特征向量,确定所述每个类别在所述多个类别中的相似类别,任一类别与相似类别之间的相似度大于与非相似类别之间的相似度;根据所述多个类别以及所述每个类别的相似类别,创建相关性网络,所述相关性网络包含所述多个类别,且所述每个类别与对应的相似类别关联;根据所述相关性网络,确定从起点类别到达终点类别所经过的迁移路径,所述起点类别和所述终点类别为所述多个类别中的任两个类别。2.根据权利要求1所述的方法,其特征在于,所述分别对所述每个类别的对象的详情信息进行特征提取,得到所述多个类别的特征向量,包括:对所述每个对象的详情信息进行特征提取,得到所述每个对象的特征向量;分别对所述每个类别的至少一个对象的特征向量进行统计,得到所述多个类别的特征向量。3.根据权利要求1所述的方法,其特征在于,所述根据所述多个类别的特征向量,确定所述每个类别在所述多个类别中的相似类别,包括:根据所述多个类别的特征向量,计算任两个类别之间的相似度;对于所述每个类别,根据所述类别与所述多个类别中除所述类别之外的其他类别之间的相似度,确定所述类别在所述多个类别中的相似类别。4.根据权利要求3所述的方法,其特征在于,所述对象的详情信息包括所述对象在多个维度上的信息,则所述类别的特征向量包括所述类别在所述多个维度上的特征值;所述根据所述类别与所述多个类别中除所述类别之外的其他类别之间的相似度,确定所述类别在所述多个类别中的相似类别,包括:根据所述多个维度创建多维空间,根据所述每个类别的特征向量在所述多个维度上的特征值,确定所述每个类别在所述多维空间中的位置;根据所述多个类别在所述多维空间中的位置,将所述多维空间划分为多个区域;对于所述每个类别,将所述类别所属区域以及所述区域的相邻区域作为备选区域,根据所述类别与所述备选区域中每个类别之间的相似度,确定所述类别在所述备选区域中的相似类别。5.根据权利要求4所述的方法,其特征在于,所述根据所述类别与所述备选区域中每个类别之间的相似度,确定所述类别在所述备选区域中的相似类别,包括:根据所述类别与所述备选区域中每个类别之间的相似度,将所述备选区域中与所述类别之间的相似度最大的类别作为所述相似类别;或者,按照与所述类别之间的相似度从大到小的顺序,从所述备选区域中选取预设数量的类别,作为所述相似类别。6.根据权利要求1所述的方法,其特征在于,所述根据所述相关性网络,确定从起点类别到达终点类别所经过的迁移路径,包括:根据所述相关性网络,确定从起点类别到达终点类别所经过的多条迁移路径;从所述多条迁移路径中选取包含的类别个数最少的迁移路径;或者,从所述多条迁移路径中选取迁移距离最小的迁移路径,任两个类别之间的迁移距离与所述任两个类别之间的相似度呈负相关关系。7.一种迁移路径生成装置,其特征在于,所述装置包括:划分模块,用于将在指定维度上的信息相同的对象划分为同一类别,得到多个类别,每个类别中包括至少一个对象,且所述每个类别的标识用所述至少一个对象在所述指定维度上的信息表示;特征提取模块,用于分别对所述每个类别的对象的详情信息进行特征提取,得到所述多个类别的特征向量,所述每个类别中包括至少一个对象;相似类别确定模块,用于根据所述多个类别的特征向量,确定所述每个类别在所述多个类别中的相似类别,任一类别与相似类别之间的相似度大于与非相似类别之间的相似度;创建模块,用于根据所述多个类别以及所述每个类别的相似类别,创建相关性网络,所述相关性网络包含所述多个类别,且所述每个类别与对应的相似类别关联;迁移路径确定模块,用于根据所述相关性网络,确定从起点类别到达终点类别所经过的迁移路径,所述起点类别和所述终点类别为所述多个类别中的任两个类别。8.根据权利要求7所述的装置,其特征在于,所述特征提取模块,包括:特征提取单元,用于对所述每个对象的详情信息进行特征提取,得到所述每个对象的特征向量;统计单元,用于分别对所述每个类别的至少一个对象的特征向量进行统计,得到所述多个类别的特征向量。9.根据权利要求7所述的装置,其特征在于,所述相似类别确定模块,包括:计算单元,用于根据所述多个类别的特征向量,计算任两个类别之间的相似度;相似类别确定单元,用于对于所述每个类别,根据所述类别与所述多个类别中除所述类别之外的其他类别之间的相似度,确定所述类别在所述多个类别中的相似类别。10.根据权利要求9所述的装置,其特征在于,所述对象的详情信息包括所述对象在多个维度上的信息,则所述类别的特征向量包括所述类别在所述多个维度上的特征值;所述相似类别确定单元,还用于根据所述多个维度创建多维空间,根据所述每个类别的特征向量在所述多个维度上的特征值,确定所述每个类别在所述多维空间中的位置;根据所述多个类别在所述多维空间中的位置,将所述多维空间划分为多个区域;对于所述每个类别,将所述类别所属区域以及所述区域的相邻区域作为备选区域,根据所述类别与所述备选区域中每个类别之间的相似度,确定所述类别在所述备选区域中的相似类别。11.根据权利要求10所述的装置,其特征在于,所述相似类别确定单元,还用于根据所述类别与所述备选区域中每个类别之间的相似度,将所述备选区域中与所述类别之间的相似度最大的类别作为所述相似类别;或者,按照与所述类别之间的相似度从大到小的顺序,从所述备选区域中选取预设数量的类别,作为所述相似类别。12.根据权利要求7所述的装置,其特征在于,所述迁移路径确定模块,包括:迁移路径确定单元,用于根据所述相关性网络,确定从起点类别到达终点类别所经过的多条迁移路径;选取单元,用于从所述多条迁移路径中选取包含的类别个数最少的迁移路径;或者,所述选取单元,用于从所述多条迁移路径中选取迁移距离最小的迁移路径,任两个类别之间的迁移距离与所述任两个类别之间的相似度呈负相关关系。13.一种迁移路径生成的装置,其特征在于,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至6任一权利要求所述的迁移路径生成方法中所执行的操作。14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如权利要求1至6任一权利要求所述的迁移路径生成方法中所执行的操作。

百度查询: 腾讯音乐娱乐科技(深圳)有限公司 迁移路径生成方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。