买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】面向地铁乘客的朋友推荐方法及系统_中国科学院深圳先进技术研究院_201910329331.2 

申请/专利权人:中国科学院深圳先进技术研究院

申请日:2019-04-23

公开(公告)日:2021-07-20

公开(公告)号:CN110162520B

主分类号:G06F16/215(20190101)

分类号:G06F16/215(20190101);G06F16/28(20190101);G06F16/29(20190101);G06F16/9536(20190101);G06F16/9537(20190101);G06Q50/00(20120101);G06Q50/30(20120101)

优先权:

专利状态码:有效-授权

法律状态:2021.07.20#授权;2019.09.17#实质审查的生效;2019.08.23#公开

摘要:本发明涉及一种面向地铁乘客的朋友推荐方法,包括:获取地铁站乘客及地铁运行的源数据;对获取的源数据进行预处理;根据预处理后的源数据推断乘客出行路径;根据地铁列车时刻表以及列车发车间隔计算详细的列车运行时刻表;根据推断的乘客出行路径及计算的列车运行时刻表,将乘客与特定列车匹配;根据匹配的乘客与特定列车,提取及度量乘客间交互情况,进行朋友推荐。本发明还涉及一种面向地铁乘客的朋友推荐系统。本发明将原本基于用户属性或静态空间的社交软件朋友推荐拓展到了动态空间中,使得乘客与列车的匹配更加精准,并能够全面量化乘客对在地铁系统中的交互情况。

主权项:1.一种面向地铁乘客的朋友推荐方法,其特征在于,该方法包括如下步骤:a.获取地铁站乘客及地铁运行的源数据;b.对获取的源数据进行预处理;c.根据预处理后的源数据推断乘客出行路径;d.根据地铁列车时刻表以及列车发车间隔计算详细的列车运行时刻表;e.根据推断的乘客出行路径及计算的列车运行时刻表,将乘客与特定列车匹配;f.根据匹配的乘客与特定列车,提取及度量乘客间交互情况,进行朋友推荐;所述的步骤e具体包括如下步骤:e1.对乘客出站刷卡时间戳进行聚类,计算乘客在每个站点的进出站步行时间;e2.根据出站刷卡时间戳减去出站站点的进出站步行时间计算下车时间戳,将非换乘乘客匹配到特定列车;e3.根据进站刷卡时间戳加上进站站点的进出站步行时间计算换乘前的上车时间戳,将单次换乘乘客匹配到特定列车;e4.根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;e5.用步骤e3推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车;所述的步骤f具体包括:f1.对地铁系统进行空间划分,得到每位乘客在每个空间中停留的时间戳,判断两个乘客是否有交互;f2.采用不同的标签命名所有的空间;f3.对于两个乘客,计算得到所述两个乘客的平均交互频率和平均交互时长;f4.分析乘客及与其在同一地铁空间共现的乘客间的平均交互频率和平均交互时长,针对平均交互频率高且平均交互时长长的乘客对进行移动社交软件的朋友推荐;所述步骤f1将地铁系统划分为三种类型的空间:进出站空间、换乘空间和列车空间;在对地铁系统分段后,得到每位乘客在每个空间中停留的时间戳,并在时间线中表示所述停留的时间戳;在同一空间内同时出现的所述停留的时间戳被归结为两个乘客的交互持续时间;如果两个乘客的交互时间等于零,则所述两个乘客没有时空共现,否则,所述两个乘客就被视为有交互。

全文数据:面向地铁乘客的朋友推荐方法及系统技术领域本发明涉及一种面向地铁乘客的朋友推荐方法及系统。背景技术城市公共交通系统包括公交系统和地铁系统作为大量人群汇聚的封闭空间,极易发生乘客间的交互,乘客间存在着大量“熟悉的陌生人”。研究公共交通系统内部的交互有助于发现具有共同出行特征的乘客,挖掘出其中存在的社会属性、行为偏好的共同点,提高移动社交软件的推荐效果。现有城市公共交通系统内的乘客交互研究主要集中在公交系统中,地铁系统中还没有得到充分研究。相比于公交系统,地铁系统更为庞大和复杂,提取地铁系统中的乘客交互存在诸多挑战,例如,换乘、上下列车均无记录,难以判断乘客在地铁系统中的具体乘车行为。现有朋友推荐技术的缺点如下:首先,目前的移动社交软件朋友推荐主要是针对用户注册资料、兴趣偏好相似性进行的,或者是基于定位距离的相近性,少有基于时空交互的朋友推荐;然后,城市公共交通系统内部存在大量“熟悉的陌生人”,通过乘客间的交互关系可以进一步挖掘出其社会属性、行为偏好的相似性,提高移动社交软件朋友推荐的效果。目前的研究集中在公交系统中,缺乏对于地铁系统内部乘客交互的研究;最后,地铁刷卡数据具有数据量大、覆盖范围广、精细化等特点,适合于地铁乘客行为的研究。但是地铁刷卡数据仅有乘客进出站的相关记录,缺乏对于地铁系统内部乘客行为的刻画,如在何处换乘、乘坐哪一趟列车等,而这些对于度量乘客间的交互情况、进行朋友推荐是十分必要的。已有的乘客与列车匹配算法是直接根据乘客的入站和出站刷卡时间来估算其乘坐的相应列车,结果具有一定的偏差,不够精准。因此,如何推断地铁系统中乘客的出行行为、度量其在地铁空间中的交互情况并基于此进行朋友推荐是目前亟待解决的问题。发明内容有鉴于此,有必要提供一种面向地铁乘客的朋友推荐方法及系统。本发明提供一种面向地铁乘客的朋友推荐方法,该方法包括如下步骤:a.获取地铁站乘客及地铁运行的源数据;b.对获取的源数据进行预处理;c.根据预处理后的源数据推断乘客出行路径;d.根据地铁列车时刻表以及列车发车间隔计算详细的列车运行时刻表;e.根据推断的乘客出行路径及计算的列车运行时刻表,将乘客与特定列车匹配;f.根据匹配的乘客与特定列车,提取及度量乘客间交互情况,进行朋友推荐。其中,所述的步骤b具体包括:对地铁原始刷卡数据进行处理;根据上述处理后的地铁原始刷卡数据,获取完整的出行OD数据;对获取的完整出行OD数据进行异常OD数据清洗。所述的步骤c具体包括:对于所有OD数据,结合地铁线路图,利用Dijkstra算法并以时间最短作为条件获取地铁空间所有OD数据的最优出行路径。所述的步骤e具体包括如下步骤:e1,对乘客出站刷卡时间戳进行聚类,计算乘客在每个站点的进出站步行时间;e2,根据出站刷卡时间戳计算下车时间戳,将非换乘乘客匹配到特定列车;e3,根据进站刷卡时间戳计算换乘前的上车时间戳,将单次换乘乘客匹配到特定列车;e4,根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;e5,用步骤e3推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车。所述的步骤f具体包括:f1,对地铁系统进行空间划分,得到每位乘客在每个空间中停留的时间戳,判断两个乘客是否有交互;f2,采用不同的标签命名所有的空间;f3,对于两个乘客,计算得到所述两个乘客的平均交互频率和平均交互时长;f4,分析乘客及与其在同一地铁空间共现的乘客间的平均交互频率和平均交互时长,针对平均交互频率高且平均交互时长长的乘客对进行移动社交软件的朋友推荐。本发明提供一种面向地铁乘客的朋友推荐系统,该系统包括该系统包括获取模块、预处理模块、推断模块、计算模块、匹配模块以及推荐模块,其中:所述获取模块用于获取地铁站乘客及地铁运行的源数据;所述预处理模块用于对获取的源数据进行预处理;所述推断模块用于根据预处理后的源数据推断乘客出行路径;所述计算模块用于根据地铁列车时刻表以及列车发车间隔计算详细的列车运行时刻表;所述匹配模块用于根据推断的乘客出行路径及计算的列车运行时刻表,将乘客与特定列车匹配;所述推荐模块还用于根据匹配的乘客与特定列车,提取及度量乘客间交互情况,进行朋友推荐。其中,所述的预处理模块具体用于:对地铁原始刷卡数据进行处理;根据上述处理后的地铁原始刷卡数据,获取完整的出行OD数据;对获取的完整出行OD数据进行异常OD数据清洗。所述的推断模块具体用于:对于所有OD数据,结合地铁线路图,利用Dijkstra算法并以时间最短作为条件获取地铁空间所有OD数据的最优出行路径。所述的匹配模块具体用于:对乘客出站刷卡时间戳进行聚类,计算乘客在每个站点的进出站步行时间;根据出站刷卡时间戳计算下车时间戳,将非换乘乘客匹配到特定列车;根据进站刷卡时间戳计算换乘前的上车时间戳,将单次换乘乘客匹配到特定列车;根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车。所述的推荐模块具体用于:对地铁系统进行空间划分,得到每位乘客在每个空间中停留的时间戳,判断两个乘客是否有交互;采用不同的标签命名所有的空间;对于两个乘客,计算得到所述两个乘客的平均交互频率和平均交互时长;分析乘客及与其在同一地铁空间共现的乘客间的平均交互频率和平均交互时长,针对平均交互频率高且平均交互时长长的乘客对进行移动社交软件的朋友推荐。本申请提供了一种面向地铁乘客的朋友推荐方法及系统,将原本基于用户属性或静态空间的社交软件朋友推荐拓展到了动态空间中;提出了一种更加精准的乘客与列车匹配方法,已有的乘客与列车匹配方法是直接根据乘客的入站和出站刷卡时间来估算其乘坐的相应列车,而本申请提出的乘客与列车匹配算法首先将乘客出行路径进行时空分割,在获取了地铁空间每个站点的步行时间以及换乘站点的不同线路之间的换乘时间的基础上,结合列车运营时刻表数据,将乘客与其乘坐的相应列车进行匹配,理论上更加精准。本申请度量地铁乘客平均交互频率和平均交互时长的方法,不仅包含列车空间,还包含进出站空间和换乘空间,能够全面量化乘客对在地铁系统中的交互情况。附图说明图1为本发明面向地铁乘客的朋友推荐方法的流程图;图2是乘客刷卡出站事件示意图;图3是乘客匹配到特定列车示意图;图4是提取和度量乘客间交互情况示意图。图5是ACF平均交互频率和ACD平均交互时长的联合分布图;图6为本发明面向地铁乘客的朋友推荐系统的硬件架构图。具体实施方式下面结合附图及具体实施例对本发明作进一步详细的说明。参阅图1所示,是本发明面向地铁乘客的朋友推荐方法较佳实施例的作业流程图。步骤S1,获取地铁站乘客及地铁运行的源数据。其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表。具体而言:在本实施例中,所述源数据包括深圳市2012年9月20个工作日的地铁刷卡数据,、深圳市2012年9月地铁线路图、深圳市2012年9月地铁列车运营时刻表。所述地铁刷卡数据包括:卡片ID、日期、时间戳、站点名称和类型如表1所示;其中,所述类型包括:刷卡进站或刷卡出站。表1步骤S2,对获取的源数据进行预处理。具体而言:1对地铁原始刷卡数据进行处理。首先,清洗掉原始刷卡数据集中存在的字段不完整以及异常数据。然后,将原始刷卡数据分成两个部分,分别为入站刷卡数据和出站刷卡数据,并将这两部分数据按时间先后进行排序,存储到数据中并建立索引,以加快后续出行乘客ODOrigintoDestination,起讫点对匹配的速度。2根据上述处理后的地铁原始刷卡数据,获取完整的出行OD数据。对于每个地铁入站事件的ID以及入站时间,寻找该ID对应的与入站时间相差最小的出站事件,合并成完整的乘客OD数据如表2所示。3对获取的完整出行OD数据进行异常OD数据清洗:删除OD数据中进出站相同的记录,此部分无法推断其出行路径。表2步骤S3,根据预处理后的源数据推断乘客出行路径。具体而言:对于所有OD数据,结合地铁线路图,利用Dijkstra迪杰斯特拉算法并以时间最短作为条件获取地铁空间所有OD数据的最优出行路径,并据此将乘客出行行为分为:非换乘出行、单次换乘出行和多次换乘出行三类。步骤S4,根据地铁列车时刻表以及列车发车间隔计算详细的列车运行时刻表。具体而言:根据从地铁集团公司公布的第一和最后一班列车的时刻表以及每条地铁线路的列车发车间隔如表3所示,计算列车到达和离开每个站点的时刻。表3步骤S5:根据推断的乘客出行路径及计算的列车运行时刻表,将乘客与特定列车匹配。具体包括:步骤S501:计算乘客在每个站点的进出站步行时间。如图21所示,当列车M到达时,乘客从列车下车,从站台步行到刷卡闸机,使时间线中的刷卡出站事件相对频繁如图22所示。在所述乘客中,第一个刷卡出站的乘客没有在刷卡闸机前等待或者在站点内逗留,因此该乘客从站台到刷卡闸机的步行时间可以代表站点的进出站步行时间。具体而言,采用DBSCAN聚类算法对乘客出站刷卡时间戳进行聚类。每个聚类簇对应于一列特定列车的到达,一个站点的进出站步行时间为聚类簇中最早的出站刷卡时间戳与在此之前最近的列车的到达时间戳从步骤S4中获得的差值。由于每趟列车均可计算得到一个进出站步行时间,而一天内存在多趟列车,每个站点可得到多个进出站步行时间。采用箱线图法剔除所得数据中的异常值,将其中的最小值作为该站点的进出站步行时间:在本实施例中,异常值被定义为小于QL-1.5IQR或大于QU+1.5IQR的值。QL称为下四分位数,表示全部观察值中有四分之一的数据取值比它小;QU称为上四分位数,表示全部观察值中有四分之一的数据取值比它大;IQR称为四分位数间距,是上四分位数QU与下四分位数QL之差。步骤S502:将非换乘乘客匹配到特定列车。根据出站刷卡时间戳减去出站站点的进出站步行时间即Td-ΔSd计算下车时间戳,将此前最近到达该站点的列车作为其匹配列车如图31所示。通过这种方式,所有的非换乘乘客都可以匹配到特定的列车上。步骤S503:将单次换乘乘客匹配到特定列车。以步骤S502的方法匹配换乘后的列车即列车M2;根据进站刷卡时间戳加上进站站点的进出站步行时间即To+ΔSo计算换乘前的上车时间戳,将此后最近到达的列车即列车M1作为其换乘前的列车如图32所示。通过这种方式,所有的单次换乘乘客都可以匹配到特定的列车上。步骤S504:计算换乘站点的换乘时间。根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值推断该站点从一条线路站台到另一条线路站台的换乘时间即ΔF。同样,可以得到换乘时间的多个值,用箱线图法剔除异常值后,将最小值作为该换乘站从一条线到另一条线的换乘时间。步骤S505:将多次换乘乘客匹配到特定列车。以二次换乘为例,用步骤S503中的方法推断出乘客乘坐的第一列和最后一列列车即M1和M3;考虑到换乘站1、2即ΔF1和ΔF2的换乘时间,认为在换乘站1换乘后发车、换乘站2换乘前到达的列车是乘客乘坐的中间列车即M2如图33所示。通过这种方式,所有的多次换乘乘客都可以匹配到特定的列车。步骤S6:根据匹配的乘客与特定列车,提取及度量乘客间交互情况,进行朋友推荐。具体包括:步骤S601:将地铁系统划分为三种类型的空间,即进出站空间、换乘空间、列车空间。以图4为例,在对地铁系统分段后,得到每位乘客在每个空间中停留的时间戳,并在时间线中表示所述时间戳。在本实施例中,行程1和2分别共享换乘空间F15和列车空间M7;行程2和3分别共享进出站空间S1和列车空间M3。在同一空间内同时出现的时间被归结为两个乘客的交互持续时间。如果两个乘客的交互时间等于零,则所述两个乘客没有时空共现,否则,上述两个乘客就被视为有交互。步骤S602:用不同的标签命名所有的空间,在本实施例中,Si表示地铁站i的进出站空间,Fj_l1_l2表示线路1到线路2在换乘站j的换乘空间,Mk表示列车k的列车空间。步骤S603:对于两个乘客,把所述两个乘客在相同空间共现的时间求和作为乘客间的交互时长。本实施例定义了两个度量标准:ACF平均交互频率和ACD平均交互时长,用于度量乘客i和j在多天内的交互情况。其中,D是天数;F是D天内交互的次数;Δtf是第f次交互的持续时间;是D天的总交互时间。步骤S604:通过分析乘客及与其在同一地铁空间共现的乘客间的平均交互频率和平均交互时长,发现平均交互频率高且平均交互时长长的乘客对,针对上述平均交互频率高且平均交互时长长的乘客对进行移动社交软件的朋友推荐。在本实施例中,根据图5所示,横轴x表示乘客对的ACF,纵轴y表示乘客对的ACD单位:分钟,坐标系中的实心点的颜色代表乘客对数量的对数值。在图5中可以发现ACF与ACD分布呈现一定的规律性,乘客对集中在图的左边底部的三角形形状,这传递了两个重要的信息。首先,大多数乘客对平均交互时间短、频率低。其次,在ACD相同的情况下,乘客对数量随ACF的增加而降低,表明不经常遇到的乘客平均交互时长变化范围较广从0到60分钟,而经常遇到的乘客平均交互时长在一个较小的范围内变化,值也较小。通过该图,可以清晰地发现那些平均交互频率高且平均交互时长长的乘客对,如设定ACD大于等于20分钟同时ACF大于等于1.5,可以针对这样的乘客对进行移动社交软件的朋友推荐。参阅图2所示,是本发明面向地铁乘客的朋友推荐系统10的硬件架构图。该系统包括:获取模块101、预处理模块102、推断模块103、计算模块104、匹配模块105以及推荐模块106。所述获取模块101用于获取地铁站乘客及地铁运行的源数据。其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表。具体而言:在本实施例中,所述源数据包括深圳市2012年9月20个工作日的地铁刷卡数据,、深圳市2012年9月地铁线路图、深圳市2012年9月地铁列车运营时刻表。所述地铁刷卡数据包括:卡片ID、日期、时间戳、站点名称和类型如表1所示;其中,所述类型包括:刷卡进站或刷卡出站。表1所述预处理模块102用于对获取的源数据进行预处理。具体包括:所述预处理模块102对地铁原始刷卡数据进行处理。首先,清洗掉原始刷卡数据集中存在的字段不完整以及异常数据。然后,将原始刷卡数据分成两个部分,分别为入站刷卡数据和出站刷卡数据,并将这两部分数据按时间先后进行排序,存储到数据中并建立索引,以加快后续出行乘客OD对匹配的速度。所述预处理模块102根据上述处理后的地铁原始刷卡数据,获取完整的出行OD数据。对于每个地铁入站事件的ID以及入站时间,寻找该ID对应的与入站时间相差最小的出站事件,合并成完整的乘客OD数据如表2所示。所述预处理模块102对获取的完整出行OD数据进行异常OD数据清洗:删除OD数据中进出站相同的记录,此部分无法推断其出行路径。表2所述推断模块103用于根据预处理后的源数据推断乘客出行路径。具体而言:对于所有OD数据,结合地铁线路图,利用Dijkstra算法并以时间最短作为条件获取地铁空间所有OD数据的最优出行路径,并据此将乘客出行行为分为:非换乘出行、单次换乘出行和多次换乘出行三类。所述计算模块104用于根据地铁列车时刻表以及列车发车间隔计算详细的列车运行时刻表。具体而言:根据从地铁集团公司公布的第一和最后一班列车的时刻表以及每条地铁线路的列车发车间隔如表3所示,计算列车到达和离开每个站点的时刻。表3所述匹配模块105用于根据推断的乘客出行路径及计算的列车运行时刻表,将乘客与特定列车匹配。具体包括:所述匹配模块105计算乘客在每个站点的进出站步行时间。如图21所示,当列车M到达时,乘客从列车下车,从站台步行到刷卡闸机,使时间线中的刷卡出站事件相对频繁如图22所示。在所述乘客中,第一个刷卡出站的乘客没有在刷卡闸机前等待或者在站点内逗留,因此该乘客从站台到刷卡闸机的步行时间可以代表站点的进出站步行时间。具体而言,采用DBSCAN聚类算法对乘客出站刷卡时间戳进行聚类。每个聚类簇对应于一列特定列车的到达,一个站点的进出站步行时间为聚类簇中最早的出站刷卡时间戳与在此之前最近的列车的到达时间戳的差值。由于每趟列车均可计算得到一个进出站步行时间,而一天内存在多趟列车,每个站点可得到多个进出站步行时间。采用箱线图法剔除所得数据中的异常值,将其中的最小值作为该站点的进出站步行时间:在本实施例中,异常值被定义为小于QL-1.5IQR或大于QU+1.5IQR的值。QL称为下四分位数,表示全部观察值中有四分之一的数据取值比它小;QU称为上四分位数,表示全部观察值中有四分之一的数据取值比它大;IQR称为四分位数间距,是上四分位数QU与下四分位数QL之差。所述匹配模块105将非换乘乘客匹配到特定列车。根据出站刷卡时间戳减去出站站点的进出站步行时间即Td-ΔSd计算下车时间戳,将此前最近到达该站点的列车作为其匹配列车如图31所示。通过这种方式,所有的非换乘乘客都可以匹配到特定的列车上。所述匹配模块105将单次换乘乘客匹配到特定列车。匹配换乘后的列车即列车M2,根据进站刷卡时间戳加上进站站点的进出站步行时间即To+ΔSo计算换乘前的上车时间戳,将此后最近到达的列车即列车M1作为其换乘前的列车如图32所示。通过这种方式,所有的单次换乘乘客都可以匹配到特定的列车上。所述匹配模块105计算换乘站点的换乘时间。根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值推断该站点从一条线路站台到另一条线路站台的换乘时间即ΔF。同样,可以得到换乘时间的多个值,用箱线图法剔除异常值后,将最小值作为该换乘站从一条线到另一条线的换乘时间。所述匹配模块105将多次换乘乘客匹配到特定列车。以二次换乘为例,推断出乘客乘坐的第一列和最后一列列车即M1和M3;考虑到换乘站1、2即ΔF1和ΔF2的换乘时间,认为在换乘站1换乘后发车、换乘站2换乘前到达的列车是乘客乘坐的中间列车即M2如图33所示。通过这种方式,所有的多次换乘乘客都可以匹配到特定的列车。所述推荐模块106用于根据匹配的乘客与特定列车,提取及度量乘客间交互情况,进行朋友推荐。具体包括:所述推荐模块106将地铁系统划分为三种类型的空间,即进出站空间、换乘空间、列车空间。以图4为例,在对地铁系统分段后,得到每位乘客在每个空间中停留的时间戳,并在时间线中表示所述时间戳。在本实施例中,行程1和2分别共享换乘空间F15和列车空间M7;行程2和3分别共享进出站空间S1和列车空间M3。在同一空间内同时出现的时间被归结为两个乘客的交互持续时间。如果两个乘客的交互时间等于零,则所述两个乘客没有时空共现,否则,上述两个乘客就被视为有交互。所述推荐模块106用不同的标签命名所有的空间,在本实施例中,Si表示地铁站i的进出站空间,Fj_l1_l2表示线路1到线路2在换乘站j的换乘空间,Mk表示列车k的列车空间。对于两个乘客,所述推荐模块106把所述两个乘客在相同空间共现的时间求和作为乘客间的交互时长。本实施例定义了两个度量标准:ACF平均交互频率和ACD平均交互时长,用于度量乘客i和j在多天内的交互情况。其中,D是天数;F是D天内交互的次数;Δtf是第f次交互的持续时间;是D天的总交互时间。所述推荐模块106通过分析乘客及与其在同一地铁空间共现的乘客间的平均交互频率和平均交互时长,发现平均交互频率高且平均交互时长长的乘客对,针对上述平均交互频率高且平均交互时长长的乘客对进行移动社交软件的朋友推荐。在本实施例中,根据图5所示,横轴x表示乘客对的ACF,纵轴y表示乘客对的ACD单位:分钟,坐标系中的实心点的颜色代表乘客对数量的对数值。在图5中可以发现ACF与ACD分布呈现一定的规律性,乘客对集中在图的左边底部的三角形形状,这传递了两个重要的信息。首先,大多数乘客对平均交互时间短、频率低。其次,在ACD相同的情况下,乘客对数量随ACF的增加而降低,表明不经常遇到的乘客平均交互时长变化范围较广从0到60分钟,而经常遇到的乘客平均交互时长在一个较小的范围内变化,值也较小。通过该图,可以清晰地发现那些平均交互频率高且平均交互时长长的乘客对,如设定ACD大于等于20分钟同时ACF大于等于1.5,可以针对这样的乘客对进行移动社交软件的朋友推荐。本发明提供一种面向地铁乘客的朋友推荐方法及系统,利用地铁刷卡数据、地铁线路图和地铁列车运营时刻表将地铁乘客匹配到特定的列车上,将乘客出行轨迹匹配到特定的地铁空间中,基于匹配结果计算乘客间的交互情况,寻找可进行朋友推荐的相关乘客。虽然本发明参照当前的较佳实施方式进行了描述,但本领域的技术人员应能理解,上述较佳实施方式仅用来说明本发明,并非用来限定本发明的保护范围,任何在本发明的精神和原则范围之内,所做的任何修饰、等效替换、改进等,均应包含在本发明的权利保护范围之内。

权利要求:1.一种面向地铁乘客的朋友推荐方法,其特征在于,该方法包括如下步骤:a.获取地铁站乘客及地铁运行的源数据;b.对获取的源数据进行预处理;c.根据预处理后的源数据推断乘客出行路径;d.根据地铁列车时刻表以及列车发车间隔计算详细的列车运行时刻表;e.根据推断的乘客出行路径及计算的列车运行时刻表,将乘客与特定列车匹配;f.根据匹配的乘客与特定列车,提取及度量乘客间交互情况,进行朋友推荐。2.如权利要求1所述的方法,其特征在于,所述的步骤b具体包括:对地铁原始刷卡数据进行处理;根据上述处理后的地铁原始刷卡数据,获取完整的出行OD数据;对获取的完整出行OD数据进行异常OD数据清洗。3.如权利要求2所述的方法,其特征在于,所述的步骤c具体包括:对于所有OD数据,结合地铁线路图,利用Dijkstra算法并以时间最短作为条件获取地铁空间所有OD数据的最优出行路径。4.如权利要求3所述的方法,其特征在于,所述的步骤e具体包括如下步骤:e1,对乘客出站刷卡时间戳进行聚类,计算乘客在每个站点的进出站步行时间;e2,根据出站刷卡时间戳计算下车时间戳,将非换乘乘客匹配到特定列车;e3,根据进站刷卡时间戳计算换乘前的上车时间戳,将单次换乘乘客匹配到特定列车;e4,根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;e5,用步骤e3推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车。5.如权利要求4所述的方法,其特征在于,所述的步骤f具体包括:f1,对地铁系统进行空间划分,得到每位乘客在每个空间中停留的时间戳,判断两个乘客是否有交互;f2,采用不同的标签命名所有的空间;f3,对于两个乘客,计算得到所述两个乘客的平均交互频率和平均交互时长;f4,分析乘客及与其在同一地铁空间共现的乘客间的平均交互频率和平均交互时长,针对平均交互频率高且平均交互时长长的乘客对进行移动社交软件的朋友推荐。6.一种面向地铁乘客的朋友推荐系统,其特征在于,该系统包括获取模块、预处理模块、推断模块、计算模块、匹配模块以及推荐模块,其中:所述获取模块用于获取地铁站乘客及地铁运行的源数据;所述预处理模块用于对获取的源数据进行预处理;所述推断模块用于根据预处理后的源数据推断乘客出行路径;所述计算模块用于根据地铁列车时刻表以及列车发车间隔计算详细的列车运行时刻表;所述匹配模块用于根据推断的乘客出行路径及计算的列车运行时刻表,将乘客与特定列车匹配;所述推荐模块还用于根据匹配的乘客与特定列车,提取及度量乘客间交互情况,进行朋友推荐。7.如权利要求6所述的系统,其特征在于,所述的预处理模块具体用于:对地铁原始刷卡数据进行处理;根据上述处理后的地铁原始刷卡数据,获取完整的出行OD数据;对获取的完整出行OD数据进行异常OD数据清洗。8.如权利要求7所述的系统,其特征在于,所述的推断模块具体用于:对于所有OD数据,结合地铁线路图,利用Dijkstra算法并以时间最短作为条件获取地铁空间所有OD数据的最优出行路径。9.如权利要求8所述的系统,其特征在于,所述的匹配模块具体用于:对乘客出站刷卡时间戳进行聚类,计算乘客在每个站点的进出站步行时间;根据出站刷卡时间戳计算下车时间戳,将非换乘乘客匹配到特定列车;根据进站刷卡时间戳计算换乘前的上车时间戳,将单次换乘乘客匹配到特定列车;根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车。10.如权利要求9所述的系统,其特征在于,所述的推荐模块具体用于:对地铁系统进行空间划分,得到每位乘客在每个空间中停留的时间戳,判断两个乘客是否有交互;采用不同的标签命名所有的空间;对于两个乘客,计算得到所述两个乘客的平均交互频率和平均交互时长;分析乘客及与其在同一地铁空间共现的乘客间的平均交互频率和平均交互时长,针对平均交互频率高且平均交互时长长的乘客对进行移动社交软件的朋友推荐。

百度查询: 中国科学院深圳先进技术研究院 面向地铁乘客的朋友推荐方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。