买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于密度聚类的货车聚类方法_中睿信数字技术有限公司_202410072493.3 

申请/专利权人:中睿信数字技术有限公司

申请日:2024-01-18

公开(公告)日:2024-04-16

公开(公告)号:CN117591904B

主分类号:G06F18/2321

分类号:G06F18/2321;G06F16/29;G06F40/289;G06F18/22;G06Q10/0833;G01S19/42

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2024.03.12#实质审查的生效;2024.02.23#公开

摘要:本发明公开一种基于密度聚类的货车聚类方法,涉及交通管理数据分析技术领域,包括以下步骤:OD分析,将货车实时GPS数据源转为OD点,并计算GeoHash值;聚类分析,采用改进的DBSCAN算法,初步计算出货车的聚类情况,得到初步货车聚类区域;区域合并,对初步货车聚类区域进行基于词向量的相似度分析,并进行空间合并,得到最终聚类区域。本发明引入采用的是货车的实时点位数据,从根源上解决数据准确性;通过构建GeoHash结构来优化查找邻居点的过程,缩短DBSCAN的计算时间;聚类算法中利用词向量相似度的分析方法,降低因密度聚类领域半径设置过小,导致的聚类区域结果过于小且离散,提高数据的可用性和鲁棒性。

主权项:1.一种基于密度聚类的货车聚类方法,其特征在于,包括以下步骤:步骤1,OD分析,获取货车实时GPS数据源,将货车实时GPS数据源转为OD点,并计算GeoHash值;步骤2,聚类分析,采用改进的DBSCAN算法,初步计算出货车的聚类情况,得到初步货车聚类区域;步骤3,区域合并,对初步货车聚类区域进行基于词向量的相似度分析,并进行空间合并,得到最终聚类区域;步骤2包括以下子步骤:步骤21,清洗掉OD轨迹过短或静止不动的OD数据,形成有效OD数据集;步骤22,初始化DBSCAN的算法参数领域半径和密度阈值;步骤23,遍历有效OD数据集,找到任意一个核心点,对核心点进行扩充;步骤24,取出核心点的GeoHash九宫格内的所有点;步骤25,寻找从核心点出发GeoHash九宫格内的所有密度相连的点;步骤26,遍历核心点的邻域内的所有核心点,寻找与这些数据点密度相连的点,直到没有可以扩充的点为止;步骤27,重新扫描有效OD数据集,寻找没有被聚类的核心点,再重复上述步骤23到步骤26对核心点进行扩充,直到有效OD数据集中没有新的核心点为止;步骤28,计算聚类区的边界和中心点,并通过GIS地理信息系统得到中心点的AOI,形成初步货车聚类区域;步骤3包括以下子步骤:步骤31,遍历初步的货车聚类区域数据集,去掉AOI区域为空的数据,并提取货车聚类区域AOI值;步骤32,对聚类区域中心点的距离进行比较,选出小于1km的中心点,称为相近的中心点;步骤33,对相近的两个的中心点地址进行分词,每个分词代表空间的一个维度,将文本转化为多维空间的向量;步骤34,根据词向量余弦的公式计算出相似度值;步骤35,合并相似度高于设定相似度阈值的区域,重新计算区域的边界和中心点;步骤36,直到货车聚类区域数据集都完成中心点地址两两比较,形成最终聚类区域。

全文数据:

权利要求:

百度查询: 中睿信数字技术有限公司 一种基于密度聚类的货车聚类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。