买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于先验概率的无监督轨迹访问地点标注方法_北京大学_202110660503.1 

申请/专利权人:北京大学

申请日:2021-06-15

公开(公告)日:2024-03-01

公开(公告)号:CN113486927B

主分类号:G06F18/23

分类号:G06F18/23;G06F16/9537;G06F16/29;G06N7/01

优先权:

专利状态码:有效-授权

法律状态:2024.03.01#授权;2021.10.26#实质审查的生效;2021.10.08#公开

摘要:本发明公开了一种基于先验概率的无监督轨迹访问地点的标注方法。该方法在不依赖标注数据的情况下,建立了综合利用时间信息与空间信息的无监督时空概率模型,对轨迹访问地点进行语义标注。该方法将时空概率分解为访问时刻概率、停留时长概率和空间概率,利用TF‑IDF加权算法计算停留对不同类型地点的潜在访问,通过统计轨迹集中所有停留的潜在访问生成访问不同类型地点时的访问时刻和停留时长的先验概率,再综合利用面地理对象的拓扑特性和点地理对象的分布来计算空间概率,通过计算地点时空概率系统化地对轨迹进行语义标注。本发明方法在实际应用中具有使用便利性和完备性的优势,方便相关部门或者公司通过用轨迹分析用户的出行目标地点和规律。

主权项:1.一种无监督轨迹访问地点标注方法,包括以下步骤:1去除轨迹中的噪声和漂移:计算轨迹中各点的速度和夹角,去除速度大于速度阈值的点和夹角小于角度阈值的点,其中所述夹角是指各点与其前后两点连线所形成的夹角;2寻找轨迹中的停留:定义每个轨迹点的邻域包含距离该点空间距离小于距离阈值的最长连续子序列,轨迹序列的密度使用序列的时间长度表示;将邻域密度超过设定时间阈值的点作为DBSCAN算法中的核心对象,反之标记为噪声点,利用DBSCAN算法寻找轨迹中所有的停留;3搜索候选地点:计算每个停留的中心位置、停留半径、停留开始时间、停留时长,并利用现有的地理信息数据搜索每个停留周围的候选地点,其中,通过计算停留中所有时空点的平均位置得到停留的中心点,停留半径为该停留中所有时空点到中心点的最大距离;停留区域指以停留中心为圆心,停留半径为半径的圆覆盖的范围;停留开始时间是指停留中时空点的最小时间;停留时长是指停留中的时空点的最大时间和最小时间之差;地理信息数据包括兴趣点和兴趣面,停留的候选地点指与停留中心距离小于设定的搜索半径的地理对象,对于兴趣点来说是指地理对象到停留中心距离小于搜索半径,对于兴趣面来说是指地理对象与停留区域相交;4计算候选地点的时空概率:停留的属性包括停留中心x,y,停留时长dur,停留开始时刻t,依据贝叶斯准则建立概率公式如下: 公式1中Oi表示停留的一个候选地点,POi|x,y,t,dur表示停留中心为x,y,停留时长为dur,停留开始时刻为t的条件下,访问地点Oi的概率;Px,y,t,dur,Oi表示停留与候选地点Oi的联合概率;Px,y,t,dur表示表示停留出现的概率,对于同一个停留为常数;利用贝叶斯公式,对Px,y,t,dur,Oi计算如下: 将公式2带入公式1可得: 假设x,y和t关于Oi是条件独立事件,x,y和dur关于Oi是条件独立事件,则: 其中对同一个停留的不同候选地点相同,计算访问时刻概率Pt|Oi,dur、停留时长概率Pdur|Oi和空间概率POi|x,y,得到候选地点的时空概率Pt|Oi,dur·Pdur|Oi·POi|x,y;5根据时空概率对所有的停留的访问地点进行标注,每个停留的访问地点为该停留候选地点中时空概率最高的地点。

全文数据:

权利要求:

百度查询: 北京大学 一种基于先验概率的无监督轨迹访问地点标注方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。