买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】面向交通数据流的最优排序算法选择方法_浙江工业大学_202110774897.3 

申请/专利权人:浙江工业大学

申请日:2021-07-08

公开(公告)日:2024-04-16

公开(公告)号:CN113553175B

主分类号:G06F9/50

分类号:G06F9/50

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2021.11.12#实质审查的生效;2021.10.26#公开

摘要:一种面向交通数据流的最优排序算法选择方法,包括以下步骤:1、获得各排序算法的运行时间‑数据量‑线程数关系拟合函数并创建算法库;2、获取计算参数并进行剪枝;3、通过已知拟合函数,计算获取当前条件下最优排序算法。本发明设计的方案可以应对在机器承受范围内包含但不限于内存余量,CPU核数的数据流快速、高效排序。同样的,与交通数据流有类似特性的大数据也可以应用本发明的方案以解决排序问题。

主权项:1.一种面向交通数据流的最优排序算法选择方法,其特征在于,所述方法包括以下步骤:1)、获得各排序算法的运行时间-数据量-线程数关系拟合函数并创建算法库,过程如下:1.1)、首先通过本地环境测试得到快速排序时间远优于其他排序算法时的最小数据规模S_max,并将所有算法标志位置1,即可用;1.2)、创建各排序算法对应的计算内存资源消耗的函数;1.3)、按运行时间-数据量-线程数关系构造中所阐述的方式,计算每个算法的拟合函数;2)、获取计算参数并进行剪枝,过程如下:2.1)、获取计算机CPU核数、可用内存大小以及待排序的数据量大小S_num;2.2)、若S_maxS_num,将算法库中除快速排序之外的所有排序算法的标志位置为0,即不可用,反之不做操作;2.3)、根据算法库中各排序算法的计算内存资源消耗函数,获取预计消耗内存大小,假设预计消耗3G内存,而当前可用内存大小为2G,将该算法标志位置为0,若所有算法标志位都为0,则算法选择结束,等待资源释放内存充足;若存在标志位为1的排序算法则执行步骤3);3)、通过已知拟合函数,计算获取当前条件下最优排序算法,过程如下:3.1)、通过拟合函数计算可用排序算法的时间开销Tn和线程数Kn;3.2)、若采用时间优先策略,将可用排序算法按照时间开销升序排列,反之将可用排序算法按照内存开销升序排列,内存开销在2.3)中算得;所述步骤1)中,创建算法库的过程为:i)根据排序算法性能测试的结果构建运行时间-数据量-线程数关系;ii)参照各排序算法的空间复杂度构造排序算法的资源计算函数,提供一个大于等于实际值的估值,避免选用因过度使用内存导致系统宕机的算法;iii)参照各排序算法的时间复杂度构造各排序算法的拟合函数,提供一个目标拟合函数,且除了快速排序拟合函数,其他排序算法的拟合函数的数据量自变量都不超过临界值S_max,减少拟合资源耗费;所述步骤1)中,算法库创建中的时间-数据量-线程数关系,算法库内各排序算法的运行时间-数据量-线程数关系分别对应一个曲面,曲面由各排序算法在不同数据量不同线程数下的实际运行时间拟合而成,各排序算法的运行时间-数据量-线程数关系构造的过程为:i)进行各排序算法在不同线程数和不同数据量大小下的时间测试;ii)利用最小二乘法拟合各排序算法对应不同线程、不同数据量下耗费时间的曲面函数;iii)该曲面函数得出后会被记录存储供实际应用时调用;所述步骤3)中,最优排序算法选择的过程为:i)获取计算机CPU核数、可用内存大小以及待排序的数据量大小S_num;ii)如果S_num大于S_max,则仅考虑快速排序,否则需要考虑所有排序算法;iii)对所有可能的排序算法利用资源计算函数,计算出各个排序算法所需的预估内存资源消耗,如果所需内存资源消耗量大于实际可用内存,则拒绝该排序算法,否则接受该排序算法为候选排序算法;iv)对所有候选排序算法利用拟合函数,计算出所有候选排序算法在当前环境下的最优线程数和最小排序时间;v)针对交通数据流的实时性特点,即交通场景对时间要求比较高,所以对所有候选排序算法的最小排序时间进行排序,取其中最小排序时间最小的排序算法,该排序算法即当前环境下最优排序算法,同时更新预测表中相应时间段的排序算法信息。

全文数据:

权利要求:

百度查询: 浙江工业大学 面向交通数据流的最优排序算法选择方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。