买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于泰森多边形和K均值聚类的时空频繁模式挖掘方法_东南大学_202110591189.6 

申请/专利权人:东南大学

申请日:2021-05-28

公开(公告)日:2024-04-09

公开(公告)号:CN113344052B

主分类号:G06F18/23213

分类号:G06F18/23213;G06N5/025

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2021.09.21#实质审查的生效;2021.09.03#公开

摘要:本发明公开了基于泰森多边形和K均值聚类的时空频繁模式挖掘方法,包括:在研究区域构建泰森多边形,利用希尔伯特分形曲线对泰森多边形内每一个多边形进行编号;获取研究区域内每个移动对象的位置信息,对数据集内对应的经纬度坐标转换到泰森多边形所在的坐标系;将移动对象的出行轨迹由时空立方体中的曲线转换成新时空空间中的点;利用K‑Means聚类对新时空空间中的点进行聚类;取聚类后每一类空间特征值表示该类频繁模式,将聚类后的结果还原到三维空间。本发明利用泰森多边形对研究区域进行描述,避免稀疏地方发生数据冗余的问题,对移动行为发生密集的地方给出更精确描述;为研究群体出行需求、出行推荐、交通规划及管理提高重要参考价值。

主权项:1.基于泰森多边形和K均值聚类的时空频繁模式挖掘方法,其特征在于,包括:1根据研究区域内兴趣点分布情况,在研究区域构建泰森多边形,利用希尔伯特分形曲线对泰森多边形内每一个多边形进行编号;2获取研究区域内每个移动对象的位置信息,将位置信息组成数据集,对数据集内有效数据对应的经纬度坐标转换到泰森多边形所在的坐标系,包括时间和空间两个维度;3对有效数据在时间和空间两个维度进行数据预处理,将移动对象的出行轨迹由时空立方体中的曲线转换成新时空空间中的点;4利用K-Means聚类对步骤3新时空空间中的点进行聚类;5取聚类后每一类空间特征值表示该类频繁模式,将聚类后的结果还原到三维空间,包括位置信息和时间信息,在矢量地图中进行可视化展示;所述步骤3数据预处理包括:31对有效数据空间维度属性进行变换,用函数将每个有效数据的经纬度转换成所在泰森多边形编号值,表达式为:Start_ID=ThiessenStart_x,Start_yStop_ID=ThiessenStop_x,Stop_yThiessen为转换函数,Start_ID和Stop_ID分别为起讫点坐标对经过Thiessen函数转换后得到的起讫点对应一维值,将Start_ID和Stop_ID作为空间特征值;32对有效数据时间维度属性进行变换:每个有效数据持续时间为[Start_Time,Stop_Time],取时间段中间值Act_Time作为变换后时间特征值,表达式为: 33将时间维度和空间维度数据分别进行归一化处理,表达式为: Normal_Value为归一化处理后得到的新值,Normal_Value包括Normal_Time,Value为归一化处理前时间或空间维度的数据值,Max和Min分别为与Value同一维度下数据集中的最大值和最小值;34构建新时间变量New_Time,表达式为:New_Time=σ*Normal_TimeNormal_Time为时间变量归一化处理后得到的值,σ为时间特征模式描述能力与空间特征模式描述能力之比,σ的取值与有效数据空间、时间特征有关,如当数据的时间属性呈现某时间段内的聚集特征,应将时间属性适当拉伸,σ>1;当数据的空间属性呈现空间上的分散特征,应将数据的空间属性适当压缩,σ<1;35将所有移动对象的出行轨迹转换为新时空空间的点,坐标为Start_ID,Stop_ID,New_Time。

全文数据:

权利要求:

百度查询: 东南大学 基于泰森多边形和K均值聚类的时空频繁模式挖掘方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。