买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】数据处理方法和装置_北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司_201710137709.X 

申请/专利权人:北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司

申请日:2017-03-09

公开(公告)日:2020-11-24

公开(公告)号:CN108573165B

主分类号:G06F21/62(20130101)

分类号:G06F21/62(20130101)

优先权:

专利状态码:有效-授权

法律状态:2020.11.24#授权;2018.10.26#实质审查的生效;2018.09.25#公开

摘要:本发明公开了一种数据处理方法和装置,涉及数据处理领域。其中的数据处理方法包括:获取预设时间段内位于某一路段聚簇上的一个或多个用户发送的服务请求;获取路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取匿名路段集中的路段上的用户形成匿名用户集;将匿名用户集中用户的位置信息或者匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向用户返回服务请求结果。通过采用路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,从而可以使匿名路段集覆盖用户与用户更接近的路段,在保证匿名路段集具有一定的分散度的基础上,使匿名路段集覆盖的范围处于有限的路段聚簇的范围中,有效地保护了用户的位置隐私。

主权项:1.一种数据处理方法,其特征在于,包括:获取预设时间段内位于某一路段聚簇上的一个或多个用户发送的服务请求;获取所述路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取所述匿名路段集中的路段上的用户形成匿名用户集;查看匿名路段集和或匿名用户集是否满足安全条件;如果匿名路段集和或匿名用户集不满足安全条件,将所述用户所在的路段聚簇的父层级路段聚簇中、与用户所在的路段距离最小的路段添加到所述匿名路段集中,并将所述匿名路段集中的路段上的用户添加到所述匿名用户集;查看根据路段聚簇的父层级路段聚簇生成的匿名路段集和或匿名用户集是否满足安全条件;如果根据路段聚簇的父层级路段聚簇生成的匿名路段集和或匿名用户集不满足安全条件,根据匿名路段集中的路段的覆盖面积与路段数的比值、虚拟用户数量在匿名用户集中的比重以及虚拟用户数量确定第一评估因子和第二评估因子,并根据第一评估因子和第二评估因子的大小选择匿名用户集和匿名路段集,其中,第一评估因子对应根据路段聚簇生成的匿名路段集和匿名用户集,第二评估因子对应根据路段聚簇的父层级路段聚簇生成的匿名路段集和匿名用户集;在匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到匿名用户集,其中,每个路段上生成的虚拟用户数占虚拟用户总数的比例与每个路段上的用户数量在匿名用户集中所占的比例一致将所述匿名用户集中用户的位置信息或者所述匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向所述用户返回服务请求结果。

全文数据:数据处理方法和装置技术领域[0001]本发明涉及数据处理领域,特别涉及一种数据处理方法和装置。背景技术[0002]LBSLocation-BasedService,基于位置的服务是利用移动用户的地理位置数据而开展的服务。LBS查询一般可以分为快照查询和连续查询。快照查询即用户提出一次查询,服务器返回一次结果的查询,如“返回离我3公里以内的所有医院”。连续查询即用户提出一次查询,服务器每隔一段时间返回一次结果的查询,如“在接下来的30分钟内,每隔5分钟返回离我最近的加油站”。[0003]在数据所带来的巨大经济利益的驱动下,LBS服务提供商可能出售用户的位置和查询内容等隐私信息,以获得商业利益。从而用户的隐私和安全可能受到威胁。[0004]针对上述情况,业界通常采用针对位置进行隐私保护的方案和针对查询进行隐私保护的方案,旨在防止用户的具体位置被泄露。针对位置进行隐私保护的方案将用户实际位置信息模糊并发送,以避免发送给LBS服务提供商准确的用户位置。针对查询进行隐私保护的方案是指保护用户的查询内容不被泄露,即隐藏用户标识与查询内容间的对应关系。[0005]在现有技术中,可以使用k-匿名技术:将某用户的位置信息与k-Ι个其他用户的位置信息混合在一起,即将用户所在的二维空间区域的位置发送给LBS服务提供商。从而,攻击者仅知道k个用户处于该区域,但无法将用户与其准确位置联系在一起。[0006]然而,在部分应用场景下,这种技术的有效性较低。例如,当用户位于人口密度过低的区域时,过度提高二维空间区域的面积会直接降低用户的服务质量;而当k个用户处于同一位置时,该用户的位置隐私仍然会被泄露。发明内容[0007]本发明实施例所要解决的一个技术问题是:如何提高用户位置隐私保护的有效性。[0008]根据本发明实施例的第一个方面,提供一种数据处理方法,包括:获取预设时间段内位于某一路段聚簇上的一个或多个用户发送的服务请求;获取路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取匿名路段集中的路段上的用户形成匿名用户集;将匿名用户集中用户的位置信息或者匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向用户返回服务请求结果。[0009]根据本发明实施例的第二个方面,提供一种数据处理装置,包括:请求获取模块,被配置为获取预设时间段内位于某一路段聚簇上的一个或多个用户发送的服务请求;匿名集形成模块,被配置为获取路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取匿名路段集中的路段上的用户形成匿名用户集;信息发送模块,被配置为将匿名用户集中用户的位置信息或者匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向用户返回服务请求结果。[0010]根据本发明实施例的第三个方面,提供一种数据处理装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种数据处理方法。[0011]根据本发明实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任意一种数据处理方法。[0012]上述发明中的一个实施例具有如下优点或有益效果:通过采用路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,从而可以使匿名路段集覆盖用户与用户更接近的路段,在保证匿名路段集具有一定的分散度的基础上,使匿名路段集覆盖的范围处于有限的路段聚簇的范围中,有效地保护了用户的位置隐私。[0013]进一步地,当本发明的实施例用于保护移动中的用户的位置隐私时,匿名路段集可以覆盖到用户可能移动到的路段,从而能够更好地对移动中的用户进行隐私保护。附图说明[0014]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。[0015]图1为本发明数据处理方法一个实施例的流程图。[0016]图2为本发明数据处理方法另一个实施例的流程图。[0017]图3为本发明数据处理方法又一个实施例的流程图。[0018]图4为本发明数据处理方法再一个实施例的流程图。[0019]图5为本发明数据处理装置一个实施例的结构图。[0020]图6为本发明数据处理装置另一个实施例的结构图。[0021]图7为本发明数据处理装置的又一个实施例的结构图。[0022]图8为本发明数据处理装置的再一个实施例的结构图。具体实施方式[0023]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0024]除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。[0025]同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。[0026]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。[0027]在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。[0028]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。[0029]图1为本发明数据处理方法一个实施例的流程图。如图1所示,该实施例的数据处理方法包括:[0030]步骤S102,获取预设时间段内位于某一路段聚簇上的一个或多个用户发送的服务请求。[0031]路段聚簇是包含若干路段的一个集合,同一路段聚簇中的路段在地理上是互相连通的。当用户位于某一路段聚簇中时,如果该用户处于移动状态,则其很可能在一段时间后位于该路段聚簇中的另一条道路上。因此,同一个路段聚簇中的用户拥有相似轨迹的可能性也更大。[0032]可以采用区域划分的方式形成路段聚簇;还可以将具有更多用户的历史轨迹的路段划分为一个路段聚簇,从而使同一个路段聚簇内的用户的行进路线相似性更大,以便于进行区域模糊处理。[0033]在一个实施例中,在步骤S102之前,可以统计道路网络中的历史轨迹和每条道路的历史流量大小。其中,用户在地图上活动经过或者覆盖的路段称为轨迹,每个路段上包含的轨迹个数称为流量。然后,重复以下过程,直到所有的路段均被添加到路段聚簇中:选择不属于任何路段聚簇的路段中流量最大的路段,作为某一路段聚簇的第一个元素;将不属于任何路段聚簇的路段中,与某一路段聚簇的边缘路段相邻并且属于同一轨迹的路段添加到某一路段聚簇中。即,在一个路段聚簇构建完成后,再构建下一个路段聚簇,直到所有的路段均属于某一个路段聚簇。其中,边缘路段是指当前的路段聚簇中位于首或尾的路段,即,与该路段相邻的路段中,既包括位于路段聚簇中的路段,也包括不位于路段聚簇中的路段。[0034]从而,可以在构建路段聚簇时同时考虑路段的轨迹特性和流量特性,使同一个路段聚簇中的路段尽可能地属于相同的一个或多个运动轨迹。[0035]步骤S104,获取路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取匿名路段集中的路段上的用户形成匿名用户集。[0036]虽然,路段聚簇中的路段已经具有区域性,或者已经包括了用户可能的运行轨迹,然而还需要进一步缩小进行模糊处理的区域范围。[0037]因此,在本发明中,仅考虑与每个用户当前所在路段相邻的路段。相邻的路段不仅距离用户当前的距离较近,并且当用户处于移动状态时,也是用户可能在下一个时段所处的路段。从而,可以选取这些路段形成匿名路段集。[0038]当发送服务请求的用户有多个时,可以按照用户的隐私度要求从高至低进行排序,并且按照排序结果依次选择用户所在的路段相邻的路段形成匿名路段集。从而可以优先添加隐私度要求高的用户的周边路段信息。[0039]在一个实施例中,可以获取路段聚簇中、与用户所在的路段在用户的行进方向上相邻的路段形成匿名路段集,并获取匿名路段集中的路段上的用户形成匿名用户集。[0040]与某一路段相邻的路段很可能有多个,而在用户的行进方向上相邻的路段是用户更有可能到达的路段,因此可以进一步缩小匿名路段集的覆盖面积,使用户的查询结果更准确。[0041]匿名路段集中路段上的用户可以是当前发送服务请求的用户,也可以是具有位置信息但未发送服务请求的用户。本领域技术人员可以根据需要进行选择。[0042]此外,也可以选择将发送服务请求的用户添加到匿名路段集,将发送服务请求的用户所在的路段添加到匿名路段集。然而,即使不添加以上信息,由于匿名路段集中已有与发送服务请求的用户非常接近的路段,因此也是可以达到本发明的技术效果的。[0043]步骤S106,将匿名用户集中用户的位置信息或者匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向用户返回服务请求结果。[0044]在获取了匿名用户集和匿名路段集后,有两种处理方法。第一种方法为,直接将匿名路段集的覆盖范围信息发送给服务器,即向服务器提供一个模糊区域,服务器根据区域的位置信息进行查询等操作,并将结果返回给发送服务请求的所有用户。第二种方法为,从匿名用户集中选取一个代表用户,该代表用户例如可以是位于匿名路段集所在区域中心的用户,也可以是随机选取的用户,还可以是采用其他方法选择的用户,然后将该用户的位置信息发送给服务器,令服务器将针对该代表用户的位置进行查询的结果返回给发送服务请求的所有用户。[0045]匿名用户集中的用户可以共享一个查询结果,从而节约了系统开销。[0046]通过采用上述实施例的方法,可以采用路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,从而可以使匿名路段集覆盖用户与用户更接近的路段,在保证匿名路段集具有一定的分散度的基础上,使匿名路段集覆盖的范围处于有限的路段聚簇的范围中,有效地保护了用户的位置隐私。[0047]进一步地,当本发明的实施例用于保护移动中的用户的位置隐私时,匿名路段集可以覆盖到用户可能移动到的路段,从而能够更好地对移动中的用户进行隐私保护。[0048]当在步骤S104中获得匿名路段集和匿名用户集后,可以检验其是否满足安全条件。安全条件例如包括如下内容:匿名路段集中的路段数大于预设值,以使匿名路段集中的用户达到一定的分散程度;匿名用户集中的用户数大于预设值,以使攻击者难以定位真实用户。本领域技术人员可以根据需要,选择其中的部分或全部安全条件,以检验匿名路段集和匿名用户集是否可以直接使用。[0049]如果匿名路段集和匿名用户集不满足安全条件,本发明的实施例还进一步提供了两种调整方式。[0050]第一种调整方式为,进一步扩大匿名集的范围。下面参考图2描述本发明另一个实施例的数据处理方法。[0051]图2为本发明数据处理方法另一个实施例的流程图。如图2所示,该实施例的数据处理方法包括:[0052]步骤S202,获取预设时间段内位于某一路段聚簇上的一个或多个用户发送的服务请求。[0053]步骤S204,获取路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取匿名路段集中的路段上的用户形成匿名用户集。[0054]其中,步骤S202〜S204的具体实施方式可以参考步骤S102〜S104。[0055]步骤S206,查看匿名路段集和或匿名用户集是否满足安全条件。[0056]步骤S208,如果匿名路段集和或匿名用户集不满足安全条件,将用户所在的路段聚簇的父层级路段聚簇中、与用户所在的路段距离最小的路段添加到匿名路段集中,并将匿名路段集中的路段上的用户添加到匿名用户集。[0057]其中,步骤S208的具体实施方式与步骤S104类似,不同之处在于,步骤S208进一步扩大了备选路段的范围,从路段聚簇的父层级路段聚簇中选择路段添加到匿名路段集中。其中,路段聚簇是路段聚簇的父层级路段聚簇的子集。[0058]步骤S206〜S208可以多次进行。例如,当根据父层级路段聚簇生成的匿名路段集、匿名用户集也不满足安全条件时,可以进一步采用父层级路段聚簇的父层级继续执行上述方法,以此类推。[0059]在步骤S202之前,可以预先构建路段聚簇树,其中,树的叶子节点是最基本的路段聚簇,根节点是路网中所有路段构成的聚簇,树中的每个父节点是其所有子节点的总和。从而,可以在路段聚簇树中查看路段聚簇的父层级路段聚簇。[0060]在一个实施例中,可以采用以下方法构建路段聚簇树。首先,将各个路段聚簇作为叶子节点;然后,重复以下过程,直到生成根节点:选取同一层级的未融合的路段聚簇中,包含的历史轨迹数最多的路段聚簇以及与包含的历史轨迹数最多的路段聚簇距离最短的路段聚簇,再将选取的两个路段聚簇融合为父层级路段聚簇,作为选取的两个路段聚簇的父节点。[0061]其中,路段聚簇之间的距离可以根据路段聚簇的中心点之间的距离计算,还可以根据不同的路段聚簇中相距最远的路段之间的距离计算,也可以采用其他方法计算,这里不再赘述。[0062]从而,可以优先处理历史轨迹数较多的路段聚簇,使历史轨迹数较多的路段聚簇的父层级不仅轨迹数多,还具有更紧凑的空间构成。[0063]步骤S210,将匿名用户集中用户的位置信息或者匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向用户返回服务请求结果。[0064]其中,步骤S210的具体实施方式可以参考步骤S106,这里不再赘述。[0065]通过采用上述实施例的方法,可以在原匿名路段集的基础上进一步扩大匿名路段集的范围,从而增加了匿名用户集中的用户数量,并且由于路段数的增加,也提高了匿名用户集中用户在空间上的分散程度,可以进一步提高用户位置隐私保护的有效性。[0066]在采用上述实施例的方法时,可以判断生成的匿名路段集的覆盖面积。如果,匿名路段集的覆盖面积超过了预设值,即当前的匿名路段集范围过大,则可以采用第二种调整方式。[0067]第二种调整方式为,生成虚假用户并添加到匿名用户集中。下面参考图3描述本发明又一个实施例的数据处理方法。[0068]图3为本发明数据处理方法又一个实施例的流程图。如图3所示,该实施例的数据处理方法包括:[0069]步骤S302,获取预设时间段内位于某一路段聚簇上的一个或多个用户发送的服务请求。[0070]步骤S304,获取路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取匿名路段集中的路段上的用户形成匿名用户集。[0071]其中,步骤S302〜S304的具体实施方式可以参考步骤S102〜S104。[0072]步骤S306,查看匿名路段集和或匿名用户集是否满足安全条件。[0073]步骤S308,如果匿名路段集和或匿名用户集不满足安全条件,在匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到匿名用户集,其中,每个路段上生成的虚拟用户数占虚拟用户总数的比例与每个路段上的用户数量在匿名用户集中所占的比例一致。[0074]S卩,生成的虚假用户与真实的用户具有一致的位置分布。[0075]步骤S310,将匿名用户集中用户的位置信息或者匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向用户返回服务请求结果。[0076]通过采用上述实施例的方法,可以通过生成与真实用户位置分布一致的虚假用户以增加匿名路段集覆盖范围内的用户数量,从而增大了攻击者确定真实的用户位置的难度,提高了用户位置隐私保护的有效性。[0077]当采用生成虚拟用户的方式时,可以基于最初的匿名集生成,还可以基于图2实施例的方式生成,即基于根据父层级的路段聚簇生成的匿名集生成虚拟用户。本领域技术人员可以根据需要进行选择。本发明的实施例提供了其中一种选择方式。下面参考图4描述本发明再一个实施例的数据处理方法。[0078]图4为本发明数据处理方法再一个实施例的流程图。如图4所示,该实施例的数据处理方法包括:[0079]步骤S402,获取预设时间段内位于第一路段聚簇上的一个或多个用户发送的服务请求。[0080]步骤S404,获取路段聚簇中、与用户所在的路段相邻的路段形成第一匿名路段集,并获取第一匿名路段集中的路段上的用户形成第一匿名用户集。[0081]其中,步骤S302〜S304的具体实施方式可以参考步骤S102〜S104。[0082]步骤S406,查看第一匿名路段集和或第一匿名用户集是否满足安全条件。[0083]步骤S408,如果第一匿名路段集和或第一匿名用户集不满足安全条件,将第一路段聚簇的父层级路段聚簇第二路段聚簇中、与用户所在的路段距离最小的路段添加到第一匿名路段集中,形成第二匿名路段集,并将第二匿名路段集中的路段上的用户添加到第一匿名用户集,形成第二匿名用户集。[0084]步骤S410,查看第二匿名路段集和或第二匿名用户集是否满足安全条件。[0085]如果第二匿名路段集、第二匿名用户集满足安全条件,可以直接采用第二匿名路段集、第二匿名用户集执行步骤S414的操作;如果第一匿名路段集、第一匿名用户集、第二匿名路段集、第二匿名用户集均不符合安全条件,可以考虑生成虚拟用户。而基于哪一个匿名集生成虚拟用户,可以采用步骤S412的方式进行选择。[0086]步骤S412,如果第二匿名路段集和或第二匿名用户集不满足安全条件,根据第一匿名路段集和第一匿名用户集生成第一评估因子,根据第二匿名路段集和第二匿名用户集生成第二评估因子,并根据第一评估因子和第二评估因子的大小选择匿名用户集和匿名路段集。[0087]其中,评估因子是根据匿名路段集中的路段的覆盖面积与路段数的比值、虚拟用户数量在匿名用户集中的比重以及虚拟用户数量确定的。[0088]当评估因子与匿名路段集中的路段的覆盖面积与路段数的比值、虚拟用户数量在匿名用户集中的比重以及虚拟用户数量均呈正相关时,选择较小的评估因子对应的匿名路段集和相应的匿名用户集;同理,当评估因子与匿名路段集中的路段的覆盖面积与路段数的比值、虚拟用户数量在匿名用户集中的比重以及虚拟用户数量均呈负相关时,选择较大的评估因子对应的匿名路段集和相应的匿名用户集。[0089]S卩,令最终所选择的匿名路段集和匿名用户集尽可能包括更多的路段数、更小的路段覆盖面积以及更少的虚拟用户数。从而,可以减少系统由于生成虚拟用户而产生的开销、用户位置更分散。[0090]评估因子的一种计算方法可以如公式⑴和⑵所示。[0091]公式⑴提供了评估因子的一种计算方法,E代表评估因子;|RSSgI代表匿名路段集所覆盖的面积;Issg|表示匿名路段集中的路段数量;k表示生成的虚拟用户数量;P表示预设的虚拟用户在匿名用户集中的比重。公式2在公式(1的基础上进一步解释了P的含义,其中T表示预设的匿名用户集应达到的用户总数。[0092;[0093]根据需要,本领域技术人员可以采用其他方式计算评估因子,这里不再赘述。[0094]在确定了选择的匿名路段集和匿名用户集后,可以将选择结果的相关信息发送给服务器,以进行进一步处理。[0095]步骤S414,在匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到匿名用户集,其中,每个路段上生成的虚拟用户数占虚拟用户总数的比例与每个路段上的当前用户数量在匿名用户集中所占的比例一致。[0096]步骤S416,将匿名用户集中用户的位置信息或者匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向用户返回服务请求结果。[0097]通过采用上述方法,可以在选择的匿名路段集和匿名用户集的基础上生成虚拟用户,从而在增加匿名路段集覆盖范围内的用户数量、增大攻击者确定真实的用户位置的难度的基础上,尽可能地减少系统开销,提升匿名用户的分散程度,提高了用户位置隐私保护的有效性。[0098]当用户处于移动状态,并且发送的请求为连续查询请求时,用户进行每次请求时都位于不同的位置。在前述各个实施例中,在同一路段聚簇中选择用户进行混淆,因此在连续查询中多次生成的匿名用户集中的用户有很大的重合几率,增大了攻击者识别用户的真实位置的难度。[0099]此外,本发明的实施例也能够保持生成的虚拟用户在运动过程中的位置合理性,即,可以令虚拟用户跟随真实用户进行移动,从而进一步增大了攻击者识别用户的真实位置的难度。[0100]在一个实施例中,设用户发送的连续服务请求包括第一服务请求和第二服务请求。当需要生成虚拟用户时,针对第一服务请求,可以采用步骤S308的具体实施方式,在第一服务请求对应的匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到第一服务请求对应的匿名用户集。当用户进行移动后,发出第二服务请求时,可以将针对第一查询请求生成的虚拟用户添加到第二服务请求对应的匿名用户集,并更新虚拟用户的位置,使虚拟用户位于根据第二服务请求对应的匿名路段集中的路段上。[0101]即,在连续查询中,保持虚拟用户的用户标识等基本信息不变,仅将其位置进行更新,使虚拟用户位于其可达的合理范围内,以增加攻击者的识别难度。[0102]下面参考图5描述本发明一个实施例的数据处理装置。[0103]图5为本发明数据处理装置一个实施例的结构图。如图5所示,该实施例的数据处理装置包括:请求获取模块51,被配置为获取预设时间段内位于某一路段聚簇上的一个或多个用户发送的服务请求;匿名集形成模块52,被配置为获取路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取匿名路段集中的路段上的用户形成匿名用户集;信息发送模块53,被配置为将匿名用户集中用户的位置信息或者匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向用户返回服务请求结果。[0104]其中,匿名集形成模块52可以进一步被配置为获取路段聚簇中、与用户所在的路段在用户的行进方向上相邻的路段形成匿名路段集,并获取匿名路段集中的路段上的用户形成匿名用户集。[0105]下面参考图6描述本发明另一个实施例的数据处理装置。[0106]图6为本发明数据处理装置另一个实施例的结构图。如图6所示,该实施例的数据处理装置还可以包括路段聚簇生成模块64,被配置为统计道路网络中的历史轨迹和每条道路的历史流量大小,并重复以下过程,直到所有的路段均被添加到路段聚簇中:选择不属于任何路段聚簇的路段中流量最大的路段,作为某一路段聚簇的第一个元素;将不属于任何路段聚簇的路段中,与某一路段聚簇的边缘路段相邻并且属于同一轨迹的路段添加到某一路段聚簇中。[0107]此外,装置还可以包括匿名集扩展模块65,被配置为查看匿名路段集和或匿名用户集是否满足安全条件,如果匿名路段集和或匿名用户集不满足安全条件,将用户所在的路段聚簇的父层级路段聚簇中、与用户所在的路段距离最小的路段添加到匿名路段集中,并将匿名路段集中的路段上的用户添加到匿名用户集。[0108]此外,装置还可以包括第一虚拟用户生成模块66,包括:安全条件检测单元661,被配置为查看匿名路段集和或匿名用户集是否满足安全条件;虚拟用户生成单元662,被配置为如果匿名路段集和或匿名用户集不满足安全条件,在匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到匿名用户集,其中,每个路段上生成的虚拟用户数占虚拟用户总数的比例与每个路段上的用户数量在匿名用户集中所占的比例一致。[0109]此外,装置还可以包括第二虚拟用户生成模块67,包括:安全条件检测单元661,被配置为查看根据路段聚簇的父层级路段聚簇生成的匿名路段集和或匿名用户集是否满足安全条件;评估因子生成单元672,被配置为如果根据路段聚簇的父层级路段聚簇生成的匿名路段集和或匿名用户集不满足安全条件,根据匿名路段集中的路段的覆盖面积与路段数的比值、虚拟用户数量在匿名用户集中的比重以及虚拟用户数量确定第一评估因子和第二评估因子,并根据第一评估因子和第二评估因子的大小选择匿名用户集和匿名路段集,其中,第一评估因子对应根据路段聚簇生成的匿名路段集和匿名用户集,第二评估因子对应根据路段聚簇的父层级路段聚簇生成的匿名路段集和匿名用户集;虚拟用户生成单元662,被配置为在匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到匿名用户集,其中,每个路段上生成的虚拟用户数占虚拟用户总数的比例与每个路段上的当前用户数量在匿名用户集中所占的比例一致。[0110]其中,服务请求可以是连续服务请求,包括第一服务请求和第二服务请求。虚拟用户生成单元663可以进一步被配置为针对第一服务请求,在第一服务请求对应的匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到第一服务请求对应的匿名用户集;针对第二服务请求,将针对第一查询请求生成的虚拟用户添加到第二服务请求对应的匿名用户集,并更新虚拟用户的位置,使虚拟用户位于根据第二服务请求对应的匿名路段集中的路段上。[0111]其中,安全条件可以包括以下至少一种:匿名路段集中的路段数大于预设值,匿名用户集中的用户数大于预设值。[0112]此外,装置还可以包括路段聚簇融合模块68,被配置为将各个路段聚簇作为叶子节点;重复以下过程,直到生成根节点:选取同一层级的未融合的路段聚簇中,包含的历史轨迹数最多的路段聚簇以及与包含的历史轨迹数最多的路段聚簇距离最短的路段聚簇;将选取的两个路段聚簇融合为父层级路段聚簇,作为选取的两个路段聚簇的父节点。[0113]图7为本发明数据处理装置的又一个实施例的结构图。如图7所示,该实施例的装置700包括:存储器710以及耦接至该存储器710的处理器720,处理器720被配置为基于存储在存储器710中的指令,执行前述任意一个实施例中的数据处理方法。[0114]其中,存储器710例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序BootLoader以及其他程序等。[0115]图8为本发明数据处理装置的再一个实施例的结构图。如图7所示,该实施例的装置700包括:存储器710以及处理器720,还可以包括输入输出接口830、网络接口840、存储接口850等。这些接口830,840,850以及存储器710和处理器720之间例如可以通过总线860连接。其中,输入输出接口830为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口840为各种联网设备提供连接接口。存储接口850为SD卡、U盘等外置存储设备提供连接接口。[0116]本发明的实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任意一种数据处理方法。[0117]本领域内的技术人员应当明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。[0118]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和或方框图来描述的。应理解为可由计算机程序指令实现流程图和或方框图中的每一流程和或方框、以及流程图和或方框图中的流程和或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和或方框图一个方框或多个方框中指定的功能的装置。[0119]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和或方框图一个方框或多个方框中指定的功能。[0120]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和或方框图一个方框或多个方框中指定的功能的步骤。[0121]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

权利要求:1.一种数据处理方法,其特征在于,包括:获取预设时间段内位于某一路段聚簇上的一个或多个用户发送的服务请求;获取所述路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取所述匿名路段集中的路段上的用户形成匿名用户集;将所述匿名用户集中用户的位置信息或者所述匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向所述用户返回服务请求结果。2.根据权利要求1所述的方法,其特征在于,还包括:统计道路网络中的历史轨迹和每条道路的历史流量大小;重复以下过程,直到所有的路段均被添加到路段聚簇中:选择不属于任何路段聚簇的路段中流量最大的路段,作为某一路段聚簇的第一个元素;将不属于任何路段聚簇的路段中,与所述某一路段聚簇的边缘路段相邻并且属于同一轨迹的路段添加到所述某一路段聚簇中。3.根据权利要求1所述的方法,其特征在于,所述获取所述路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取所述匿名路段集中的路段上的用户形成匿名用户集包括:获取所述路段聚簇中、与用户所在的路段在用户的行进方向上相邻的路段形成匿名路段集,并获取所述匿名路段集中的路段上的用户形成匿名用户集。4.根据权利要求1所述的方法,其特征在于,还包括:查看匿名路段集和或匿名用户集是否满足安全条件;如果匿名路段集和或匿名用户集不满足安全条件,将所述用户所在的路段聚簇的父层级路段聚簇中、与用户所在的路段距离最小的路段添加到所述匿名路段集中,并将所述匿名路段集中的路段上的用户添加到所述匿名用户集。5.根据权利要求1所述的方法,其特征在于,还包括:查看匿名路段集和或匿名用户集是否满足安全条件;如果匿名路段集和或匿名用户集不满足安全条件,在匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到匿名用户集,其中,每个路段上生成的虚拟用户数占虚拟用户总数的比例与每个路段上的用户数量在匿名用户集中所占的比例一致。6.根据权利要求4所述的方法,其特征在于,还包括:查看根据路段聚簇的父层级路段聚簇生成的匿名路段集和或匿名用户集是否满足安全条件;如果根据路段聚簇的父层级路段聚簇生成的匿名路段集和或匿名用户集不满足安全条件,根据匿名路段集中的路段的覆盖面积与路段数的比值、虚拟用户数量在匿名用户集中的比重以及虚拟用户数量确定第一评估因子和第二评估因子,并根据第一评估因子和第二评估因子的大小选择匿名用户集和匿名路段集,其中,第一评估因子对应根据路段聚簇生成的匿名路段集和匿名用户集,第二评估因子对应根据路段聚簇的父层级路段聚簇生成的匿名路段集和匿名用户集;在匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到匿名用户集,其中,每个路段上生成的虚拟用户数占虚拟用户总数的比例与每个路段上的用户数量在匿名用户集中所占的比例一致。7.根据权利要求5或6所述的方法,其特征在于,所述服务请求是连续服务请求,包括第一服务请求和第二服务请求;所述在匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到匿名用户集包括:针对所述第一服务请求,在第一服务请求对应的匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到第一服务请求对应的匿名用户集;针对所述第二服务请求,将针对第一查询请求生成的虚拟用户添加到第二服务请求对应的匿名用户集,并更新所述虚拟用户的位置,使所述虚拟用户位于根据第二服务请求对应的匿名路段集中的路段上。8.根据权利要求4-6中任一项所述的方法,其特征在于,所述安全条件包括以下至少一种:匿名路段集中的路段数大于预设值,匿名用户集中的用户数大于预设值。9.根据权利要求1-6中任一项所述的方法,其特征在于,还包括:将各个路段聚簇作为叶子节点;重复以下过程,直到生成根节点:选取同一层级的未融合的路段聚簇中,包含的历史轨迹数最多的路段聚簇以及与所述包含的历史轨迹数最多的路段聚簇距离最短的路段聚簇;将选取的两个路段聚簇融合为父层级路段聚簇,作为选取的两个路段聚簇的父节点。10.—种数据处理装置,其特征在于,包括:请求获取模块,被配置为获取预设时间段内位于某一路段聚簇上的一个或多个用户发送的服务请求;匿名集形成模块,被配置为获取所述路段聚簇中、与用户所在的路段相邻的路段形成匿名路段集,并获取所述匿名路段集中的路段上的用户形成匿名用户集;信息发送模块,被配置为将所述匿名用户集中用户的位置信息或者所述匿名路段集的覆盖范围信息发送给服务器,以便服务器根据接收到的信息向所述用户返回服务请求结果。11.根据权利要求10所述的装置,其特征在于,还包括路段聚簇生成模块,被配置为统计道路网络中的历史轨迹和每条道路的历史流量大小,并重复以下过程,直到所有的路段均被添加到路段聚簇中:选择不属于任何路段聚簇的路段中流量最大的路段,作为某一路段聚簇的第一个元素;将不属于任何路段聚簇的路段中,与所述某一路段聚簇的边缘路段相邻并且属于同一轨迹的路段添加到所述某一路段聚簇中。12.根据权利要求10所述的装置,其特征在于,所述匿名集形成模块进一步被配置为获取所述路段聚簇中、与用户所在的路段在用户的行进方向上相邻的路段形成匿名路段集,并获取所述匿名路段集中的路段上的用户形成匿名用户集。13.根据权利要求10所述的装置,其特征在于,还包括匿名集扩展模块,被配置为查看匿名路段集和或匿名用户集是否满足安全条件,如果匿名路段集和或匿名用户集不满足安全条件,将所述用户所在的路段聚簇的父层级路段聚簇中、与用户所在的路段距离最小的路段添加到所述匿名路段集中,并将所述匿名路段集中的路段上的用户添加到所述匿名用户集。14.根据权利要求10所述的装置,其特征在于,还包括第一虚拟用户生成模块,包括:安全条件检测单元,被配置为查看匿名路段集和或匿名用户集是否满足安全条件;虚拟用户生成单元,被配置为如果匿名路段集和或匿名用户集不满足安全条件,在匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到匿名用户集,其中,每个路段上生成的虚拟用户数占虚拟用户总数的比例与每个路段上的用户数量在匿名用户集中所占的比例一致。15.根据权利要求13所述的装置,其特征在于,还包括第二虚拟用户生成模块,包括:安全条件检测单元,被配置为查看根据路段聚簇的父层级路段聚簇生成的匿名路段集和或匿名用户集是否满足安全条件;评估因子生成单元,被配置为如果根据路段聚簇的父层级路段聚簇生成的匿名路段集和或匿名用户集不满足安全条件,根据匿名路段集中的路段的覆盖面积与路段数的比值、虚拟用户数量在匿名用户集中的比重以及虚拟用户数量确定第一评估因子和第二评估因子,并根据第一评估因子和第二评估因子的大小选择匿名用户集和匿名路段集,其中,第一评估因子对应根据路段聚簇生成的匿名路段集和匿名用户集,第二评估因子对应根据路段聚簇的父层级路段聚簇生成的匿名路段集和匿名用户集;虚拟用户生成单元,被配置为在匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到匿名用户集,其中,每个路段上生成的虚拟用户数占虚拟用户总数的比例与每个路段上的用户数量在匿名用户集中所占的比例一致。16.根据权利要求14或15所述的装置,其特征在于,所述服务请求是连续服务请求,包括第一服务请求和第二服务请求;所述虚拟用户生成单元进一步被配置为针对所述第一服务请求,在第一服务请求对应的匿名路段集中的路段上生成虚拟用户,并将生成的虚拟用户添加到第一服务请求对应的匿名用户集;针对所述第二服务请求,将针对第一查询请求生成的虚拟用户添加到第二服务请求对应的匿名用户集,并更新所述虚拟用户的位置,使所述虚拟用户位于根据第二服务请求对应的匿名路段集中的路段上。17.根据权利要求13-15中任一项所述的装置,其特征在于,所述安全条件包括以下至少一种:匿名路段集中的路段数大于预设值,匿名用户集中的用户数大于预设值。18.根据权利要求10-15中任一项所述的装置,其特征在于,还包括路段聚簇融合模块,被配置为将各个路段聚簇作为叶子节点;重复以下过程,直到生成根节点:选取同一层级的未融合的路段聚簇中,包含的历史轨迹数最多的路段聚簇以及与所述包含的历史轨迹数最多的路段聚簇距离最短的路段聚簇;将选取的两个路段聚簇融合为父层级路段聚簇,作为选取的两个路段聚簇的父节点。19.一种数据处理装置,其特征在于,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1-9中任一项所述的数据处理方法。20.—种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-9中任一项所述的数据处理方法。

百度查询: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 数据处理方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。