买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于角度划分和位置语义的轨迹隐私保护算法_东华大学_201710539901.1 

申请/专利权人:东华大学

申请日:2017-07-04

公开(公告)日:2020-05-26

公开(公告)号:CN107480550B

主分类号:G06F21/62(20130101)

分类号:G06F21/62(20130101);G06F16/9537(20190101)

优先权:

专利状态码:有效-授权

法律状态:2020.05.26#授权;2018.01.09#实质审查的生效;2017.12.15#公开

摘要:本发明提供了一种基于角度划分和位置语义的轨迹隐私保护算法,步骤1:初始化生成网格地图模型,为网格地图模型随机分配各种位置类型;步骤2:用户输入信息;步骤3:处理用户输入的信息;步骤4:用户提出服务查询请求,输入当前时刻的位置坐标;步骤5:根据所述位置坐标进行角度划分,产生多个虚假位置九宫格区域;步骤6:根据当前位置语义,选择合适的虚假位置;步骤7:将所有时刻生成的虚假位置连接起来,产生虚假轨迹。本发明将位置语义和轨迹隐私保护算法相结合,用位置普及度、敏感度和隐私度来量化位置语义信息,对位置语义信息进行数学建模,通过模型准确描述位置语义信息,能够实现用户真实轨迹的隐私保护。

主权项:1.一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于,包括以下步骤:步骤1:初始化生成网格地图模型,为网格地图模型随机分配各种位置类型;步骤2:用户输入信息;用户输入的信息包括:角度L、职业profession、年龄age、性格character、对所述各种位置类型的位置敏感度seni;步骤3:处理用户输入的信息;步骤3具体包括以下子步骤:步骤3.1:根据用户输入的角度L,计算所需虚假轨迹数目fake和对应弧度rad;fake=2*180Lrad=L180.0*3.14159;步骤3.2:计算对应该用户属性的位置普及度集合popi,计算方式如下:popi=popi1+profession*characterage其中,popi1代表位置普及度的基准值,是在不考虑二次访问的情况下,使用区域的用户在24小时内访问各种位置类型的人流量乘以常量10;人流量为访问次数除以使用区域的总人数;步骤3.3:根据位置普及度popi和用户输入的位置敏感度seni,计算所有位置类型的位置隐私度prmi,计算方式如下: 步骤4:用户提出服务查询请求,输入当前时刻的位置坐标x,y;步骤5:根据所述位置坐标进行角度划分,产生多个虚拟位置九宫格区域;角度划分是以网格地图为中心点为原点,当前真实位置和原点之间的欧式距离为半径,每划过一次对应弧度rad,即得到一个虚假位置区域中心,虚假位置区域中心和围绕虚假位置区域中心的八个位置共同构成虚假位置九宫格区域;步骤5具体包括以下子步骤:步骤5.1:将当前真实位置作为第一条虚假轨迹的虚假位置区域中心,围绕该位置的八个位置共同构成虚假位置九宫格区域;步骤5.2:根据角度划分定位第二条虚假轨迹的虚假位置区域中心,围绕该位置的八个位置共同构成虚假位置九宫格区域;步骤5.3:继续进行角度划分找到下一个虚假位置区域中心,直至角度划分经过一个圆周达到虚假轨迹数目要求;步骤6:根据当前位置语义,选择合适的虚假位置;步骤6具体包括以下子步骤:步骤6.1:判断当前位置的位置隐私度是否超过设定的隐私度阈值a;步骤6.2:若超过a,说明当前位置对于用户而言为非隐私位置,不用考虑抑制发布,则在各个虚假位置九宫格区域中选择和用户当前位置类型相一致的场所作为虚假位置;步骤6.3:若未超过a,说明当前位置对于用户而言为隐私位置,需考虑抑制发布,即进行选择性替换,则在各个虚假位置九宫格区域中随机选择除真实位置外任一场所作为虚假位置;步骤7:将所有时刻生成的虚假位置连接起来,产生虚假轨迹。

全文数据:一种基于角度划分和位置语义的轨迹隐私保护算法技术领域[0001]本发明涉及轨迹隐私保护技术领域,特别是涉及一种基于角度划分和位置语义的轨迹隐私保护算法。背景技术[0002]目前,隐私保护技术大多是只考虑了单点查询的情况。这种基于单点查询的隐私保护技术很难适用于真实场景。因为,用户很有可能在一段时间或某个区域里连续提出位置查询请求。如果将某个用户的所有位置查询地点连接起来,就可以获得用户的活动轨迹信息。经过分析用户的运行轨迹,能够间接推测用户日常生活中的行为习惯、个人喜好等等,这些信息的泄露往往会带来更加不可估量的损失。[0003]虚假轨迹技术和抑制法技术是轨迹隐私保护中常用的两种重要技术。但是,这两种技术存在一定的不足。例如:当攻击者掌握了足够的匿名空间背景知识时,攻击者可以通过这些匿名空间背景知识,分析、推断出许多真实轨迹信息,使得轨迹隐私保护的效果变差。[0004]对于用户连续查询所形成的运行轨迹,有一个关键性的问题值得思考,S卩:如何在保证用户获得高质量的位置服务的同时,避免自己的隐私信息被攻击者截取。如果这个问题能够有一个较好的解决方案,就能够更好地满足用户对于这类位置服务应用的需求,也能够更有效地维护互联网的健康发展,杜绝网络犯罪。然而,从目前已公开的文献来看,能很好地解决上述问题的技术方案还未见公开报道。发明内容[0005]本发明要解决的技术问题是如何实现用户在连续查询情况下形成的运行轨迹的隐私保护。[0006]为了解决上述技术问题,本发明的技术方案是提供一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于,包括以下步骤:[0007]步骤1:初始化生成网格地图模型,为网格地图模型随机分配各种位置类型;[0008]步骤2:用户输入信息;[0009]步骤3:处理用户输入的信息;[0010]步骤4:用户提出服务查询请求,输入当前时刻的位置坐标x,y;[0011]步骤5:根据所述位置坐标进行角度划分,产生多个虚假位置九宫格区域;[0012]步骤6:根据当前位置语义,选择合适的虚假位置;[0013]步骤7:将所有时刻生成的虚假位置连接起来,产生虚假轨迹。[0014]优选地,所述位置语义包括:位置普及度、位置敏感度和位置隐私度;[0015]位置普及度,表示该位置类型的热门程度,与用户职业、年龄和性格相关;数值越大,表示位置普及度越高;[0016]位置敏感度,表示该位置类型对于当前用户的敏感程度,由用户直接输入,数值越大,表示越敏感;[0017]位置隐私度,由位置普及度和位置敏感度共同决定,数值越大,表示隐私保护程度越好。[0018]优选地,所述步骤1具体包括以下子步骤:[0019]步骤1.1:使用整型二维数组建立平面的网格地图模型,每个网格代表设定面积的位置类型;[0020]步骤1.2:为网格地图模型随机分配各种位置类型,用不同的字符表示不同的位置类型。[0021]更优选地,所述步骤1.2中,位置类型包括超市、学校、医院、住宅区、车站、娱乐场所,分别用数字〇〜6表示。[0022]优选地,所述步骤2中,用户输入的信息包括:角度L、职业profession、年龄age、性格character、对所述各种位置类型的位置敏感度sem。[0023]优选地,所述步骤3具体包括以下子步骤:[0024]步骤3.1:根据用户输入的角度L,计算所需虚假轨迹数目fake和对应弧度rad;[0025]fake=2*180L[0026]rad=L180.0*3.14159;[0027]步骤3.2:计算对应该用户属性的位置普及度集合popi,计算方式如下:[0028]popi=popu+profession氺characterage[0029]其中,popn代表位置普及度的基准值,是在不考虑二次访问的情况下,使用区域的用户在24小时内访问各种位置类型的人流量乘以常量10;人流量为访问次数除以使用区域的总人数;[0030]步骤3.3:根据位置普及度Pop1和用户输入的位置敏感度sem,计算所有位置类型的位置隐私度prnu,计算方式如下:[0032]优选地,所述步骤4中,若是用户提出连续查询服务,将每隔时刻t再提出下一查询服务;t为设定的间隔时间。[0033]优选地,所述步骤5中,角度划分是以网格地图中心点为原点,当前真实位置和原点之间的欧式距离为半径,每划过一次对应弧度rad,即得到一个虚假位置区域中心,虚假位置区域中心和围绕虚假位置区域中心的八个位置共同构成虚假位置九宫格区域。[0034]优选地,所述步骤5具体包括以下子步骤:[0035]步骤5.1:将当前真实位置作为第一条虚假轨迹的虚假位置区域中心,围绕该位置的八个位置共同构成虚假位置九宫格区域;[0036]步骤5.2:根据角度划分定位第二条虚假轨迹的虚假位置区域中心,围绕该位置的八个位置共同构成虚假位置九宫格区域;[0037]步骤5.3:继续进行角度划分找到下一个虚假位置区域中心,直至角度划分经过一个圆周达到虚假轨迹数目要求。[0038]优选地,所述步骤6具体包括以下子步骤:[0039]步骤6.1:判断当前位置的位置隐私度是否超过设定的隐私度阈值a;[0040]步骤6.2:若超过a,说明当前位置对于用户而言为非隐私位置,不用考虑抑制发布,则在各个虚假位置九宫格区域中选择和用户当前位置类型相一致的场所作为虚假位置;[0041]步骤6.3:若未超过a,说明当前位置对于用户而言为隐私位置,需考虑抑制发布,即进行选择性替换,则在各个虚假位置九宫格区域中随机选择除真实位置外任一场所作为虚假位置。[0042]优选地,所述步骤7产生的虚假轨迹将和真实轨迹具有极为相似的用户行为模式和轨迹结构,更具欺骗性。[0043]本发明提供的算法克服了现有技术的不足,将位置语义和轨迹隐私保护算法相结合,具有如下有益效果:[0044]1、本发明用位置普及度、敏感度和隐私度来量化位置语义信息,对位置语义信息进行数学建模,通过模型准确描述位置语义信息。[0045]2、本发明的虚假轨迹生成通过基于角度的划分,可以保证每条虚假轨迹上的点距离原点的欧式距离和真实轨迹上的点保持一致,这可以有效抵御背景知识攻击。[0046]3、本发明在虚假位置的选择上,在形成虚假位置九宫格区域内,优先选择和当前真实位置类型相一致的场所作为虚假位置,能够保证虚假轨迹和真实轨迹之间具有相似的用户行为模式。[0047]4、本发明对于真实轨迹中隐私度不超过阈值的隐私位置,进行了抑制发布,即选择性替换,在各个虚假位置九宫格区域中随机选择一场所作为虚假位置,可以有效减少隐私信息的泄漏。附图说明[0048]图1为本实施例提供的基于角度划分和位置语义的轨迹隐私保护算法流程图;[0049]图2为用户输入角度90度的虚假轨迹生成图。具体实施方式[0050]下面结合具体实施例,进一步阐述本发明。[0051]图1为本实施例提供的基于角度划分和位置语义的轨迹隐私保护算法流程图,所述的基于角度划分和位置语义的轨迹隐私保护算法包括以下步骤:A初始化生成网格地图模型;B用户输入信息(角度L、职业profession、年龄age、性格character、位置敏感度sem;C处理用户输入信息;D用户提出服务查询请求,输入当前时刻的位置坐标x,y;E根据该位置坐标进行角度划分,生成多个虚假位置九宫格区域;F根据当前位置语义,选择合适的虚假位置;G将所有时刻生成的虚假位置连接起来,产生虚假轨迹。[0052]位置语义包括:位置普及度popi、位置敏感度sem和位置隐私度prmi。[0053]位置普及度,表示该位置类型的热门程度,数值越大,普及度越高。考虑用户职业、年龄和性格。[0054]位置敏感度,表示该位置类型对于当前用户的敏感程度,由用户直接输入,数值越大,表示越敏感。[0055]位置隐私度,由位置普及度和位置敏感度共同决定,数值越大,表示隐私保护程度越好。[0056]其中,步骤A具体包括:[0057]Al.使用整型二维数组建立平面网格地图模型,每个网格代表100*100m2的位置。[0058]A2.为网格地图模型随机分配6种位置类型超市-0、学校-1、医院-2、住宅区-3、车站-4、娱乐场所-5中的一种,用数字0-6表示对应的位置类型。[0059]其中,步骤B具体包括:[0060]BI.用户输入角度L。[0061]B2.用户在学生、医生、上班族、其他这四个选项中选择自己的职业。[0062]B3.用户选择年龄范围,小于18岁,18-24岁,25-34岁,35-44岁,45岁及以上。[0063]B4.用户在内向、较内向、较外向、外向这四个选项中选择自己的性格。[0064]B5.用户依次输入对目前6种位置类型的敏感度。[0065]步骤B2的选择,对于位置普及度的影响由学生、医生、其他、上班族依次增大;步骤B3的选择,年龄和位置普及度呈正相关;步骤M的选择,位置普及度随着性格的外向程度增加而增加。[0066]其中,步骤C具体包括:[0067]Cl.根据输入角度L,计算所需虚假轨迹数目fake和对应弧度rad。[0068]C2.根据位置普及度数学模型,计算对应该用户属性的位置普及度集合p〇Pl,计算方式如下:[0069]popi=popn+profession^characterage4-1[0070]其中,popn代表位置普及度的基准值,是在不考虑二次访问的情况下,使用区域的用户在24小时内访问6种位置类型的人流量乘以常量10。人流量为访问次数除以使用区域的总人数。[0071]C3.根据位置普及度和用户输入的位置敏感度计算所有位置类型的位置隐私度prnu,计算方式如下:[0073]根据大量实验数据,系统预先设定了位置隐私度阈值0.4。位置隐私度prnu的数值越大,表明隐私保护程度越好。[0074]其中,步骤Cl的虚假轨迹数目fake和弧度rad按如下公式计算:[0075]fake=2*180L4-3[0076]rad=L180.0*3.141594-4[0077]其中,步骤D用户提出位置查询服务,输入自己当前位置坐标x,y,若是用户提出连续查询服务,将每隔时刻t再提出下一查询服务。t为设定的间隔时间。[0078]其中,步骤E具体包括:[0079]El.将当前真实位置作为第一条虚假轨迹的虚假位置区域中心,围绕该位置的八个位置共同构成虚假位置九宫格区域。[0080]E2.根据角度划分定位第二条虚假轨迹的虚假位置区域中心,围绕该位置的八个位置共同构成虚假位置九宫格区域。[0081]E3.继续进行角度划分找到下一个虚假位置区域中心,直至角度划分经过一个圆周达到虚假轨迹数目要求。[0082]其中,步骤E2的角度划分,按如下公式定位虚假位置区域中心的二维坐标fake_x,fake_y:[0085]其中,i为初始为I的循环变量。i不大于fake。[0086]例如,用户输入角度90度的虚假轨迹生成图,如图2所示。[0087]其中,步骤F具体包括:[0088]Fl.判断当前位置的位置隐私度是否超过隐私度阈值0.4;[0089]F2.若超过0.4,在各个虚假位置九宫格区域中选择和用户当前位置类型相一致的场所作为虚假位置。[0090]F3.若未超过0.4,在各个虚假位置九宫格区域中随机选择除真实位置外任一场所作为虚假位置。[0091]由前述说明可知,本发明考虑了用位置普及度、敏感度和隐私度这三个概念量化位置语义信息,将较为棘手的位置语义信息简化为数据进行计算,具有简洁高效的优点。[0092]本发明的虚假轨迹是基于角度的,每条虚假轨迹上的位置点距离原点的欧式距离都将和真实轨迹保持基本一致的情况,能够有效抵御背景知识攻击。本发明在虚假位置的选择上,在形成虚假位置九宫格区域内,率先选择和当前真实位置类型相一致的场所作为虚假位置,能够保证虚假轨迹和真实轨迹之间具有相似用户行为模式。本发明对于真实轨迹中隐私度不超过阈值的隐私位置,进行了抑制发布,即选择性替换,在各个虚假位置九宫格区域中随机选择除当前真实位置外任一场所作为虚假位置,有效减少隐私信息的泄漏。[0093]试验表明,本发明提供的算法可以实现用户真实轨迹的隐私保护。[0094]以上所述,仅为本发明的较佳实施例,并非对本发明任何形式上和实质上的限制,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还将可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。凡熟悉本专业的技术人员,在不脱离本发明的精神和范围的情况下,当可利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对上述实施例所作的任何等同变化的更动、修饰与演变,均仍属于本发明的技术方案的范围内。

权利要求:1.一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于,包括以下步骤:步骤1:初始化生成网格地图模型,为网格地图模型随机分配各种位置类型;步骤2:用户输入信息;步骤3:处理用户输入的信息;步骤4:用户提出服务查询请求,输入当前时刻的位置坐标x,y;步骤5:根据所述位置坐标进行角度划分,产生多个虚假位置九宫格区域;步骤6:根据当前位置语义,选择合适的虚假位置;步骤7:将所有时刻生成的虚假位置连接起来,产生虚假轨迹。2.如权利要求1所述的一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于:所述位置语义包括:位置普及度、位置敏感度和位置隐私度;位置普及度,表示该位置类型的热门程度,与用户职业、年龄和性格相关;数值越大,表示位置普及度越高;位置敏感度,表示该位置类型对于当前用户的敏感程度,由用户直接输入,数值越大,表示越敏感;位置隐私度,由位置普及度和位置敏感度共同决定,数值越大,表示隐私保护程度越好。3.如权利要求1所述的一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于:所述步骤1具体包括以下子步骤:步骤1.1:使用整型二维数组建立平面的网格地图模型,每个网格代表设定面积的位置;步骤1.2:为网格地图模型随机分配各种位置类型,用不同的字符表示不同的位置类型。4.如权利要求3所述的一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于:所述步骤1.2中,位置类型包括超市、学校、医院、住宅区、车站、娱乐场所,分别用数字O〜6表不。5.如权利要求1所述的一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于:所述步骤2中,用户输入的信息包括:角度L、职业profession、年龄age、性格character、对所述各种位置类型的位置敏感度sem。6.如权利要求5所述的一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于:所述步骤3具体包括以下子步骤:步骤3.1:根据用户输入的角度L,计算所需虚假轨迹数目fake和对应弧度rad;fake=2*180Lrad=L180.0*3.14159;步骤3.2:计算对应该用户属性的位置普及度集合popi,计算方式如下:poPi=poPii+profession*characterage其中,P〇pn代表位置普及度的基准值,是在不考虑二次访问的情况下,使用区域的用户在24小时内访问各种位置类型的人流量乘以常量10;人流量为访问次数除以使用区域的总人数;步骤3.3:根据位置普及度p〇Pl和用户输入的位置敏感度sem,计算所有位置类型的位置隐私度Prm1,计算方式如下:7.如权利要求1所述的一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于:所述步骤4中,若是用户提出连续查询服务,将每隔时刻t再提出下一查询服务;t为设定的间隔时间。8.如权利要求6所述的一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于:所述步骤5中,角度划分是以网格地图中心点为原点,当前真实位置和原点之间的欧式距离为半径,每划过一次对应弧度rad,即得到一个虚假位置区域中心,虚假位置区域中心和围绕虚假位置区域中心的八个位置共同构成虚假位置九宫格区域。9.如权利要求8所述的一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于:所述步骤5具体包括以下子步骤:步骤5.1:将当前真实位置作为第一条虚假轨迹的虚假位置区域中心,围绕该位置的八个位置共同构成虚假位置九宫格区域;步骤5.2:根据角度划分定位第二条虚假轨迹的虚假位置区域中心,围绕该位置的八个位置共同构成虚假位置九宫格区域;步骤5.3:继续进行角度划分找到下一个虚假位置区域中心,直至角度划分经过一个圆周达到虚假轨迹数目要求。10.如权利要求1所述的一种基于角度划分和位置语义的轨迹隐私保护算法,其特征在于:所述步骤6具体包括以下子步骤:步骤6.1:判断当前位置的位置隐私度是否超过设定的隐私度阈值a;步骤6.2:若超过a,说明当前位置对于用户而言为非隐私位置,不用考虑抑制发布,则在各个虚假位置九宫格区域中选择和用户当前位置类型相一致的场所作为虚假位置;步骤6.3:若未超过a,说明当前位置对于用户而言为隐私位置,需考虑抑制发布,即进行选择性替换,则在各个虚假位置九宫格区域中随机选择除真实位置外任一场所作为虚假位置。

百度查询: 东华大学 一种基于角度划分和位置语义的轨迹隐私保护算法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。