买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种通过建立单调正相关过滤网的异常物流订单检测方法_上海品见智能科技有限公司_202011282131.5 

申请/专利权人:上海品见智能科技有限公司

申请日:2020-11-16

公开(公告)日:2024-04-02

公开(公告)号:CN112348644B

主分类号:G06Q30/0601

分类号:G06Q30/0601;G06Q10/0834;G06F18/2433

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2021.04.02#实质审查的生效;2021.02.09#公开

摘要:本发明公开了一种通过建立单调正相关过滤网的异常物流订单检测方法,包括如下步骤:获取数据源,包括货源的基本数据与配送费;进行必要的数据清洗,包括缺失值处理与必要格式转换;计算变量间的相关性,分析出与配送费有正相关性的自变量,确定出重要的影响变量;将各因变量进行分箱,分别进行小区间等级划分;分析每种区间组合上配送费的分布并确定各组上下界值,包括组合各自变量,分析每种区间组合上,配送费的分布并确定上下界值,初步形成过滤网;利用正相关性,对过滤网进行矫正,保证随着区间取值的增大,配送费的下界值不减;本发明在保证可解释性与灵活性的前提下,有效提高异常物流订单检测的准确度。

主权项:1.一种通过建立单调正相关过滤网的异常物流订单检测方法,其特征在于,包括如下步骤:获取数据源,包括货源的基本数据与配送费;进行必要的数据清洗,包括缺失值处理与必要格式转换;计算变量间的相关性,分析出与配送费有正相关性的自变量,确定出重要的影响变量;将各因变量进行分箱,分别进行小区间等级划分;分析每种区间组合上配送费的分布并确定各组上下界值,包括组合各自变量,分析每种区间组合上配送费的分布并基于概率统计方法的3σ准则确定上下界值,初步形成过滤网;利用正相关性,对过滤网进行矫正,保证随着区间取值的增大,配送费的下界值不减;随着区间取值的减小,配送费的上界值不增,形成过滤网模型;建立配送费预测模型,对比模型效果说明通过过滤网模型剔除异常样本的必要性与有效性,包括对物流交易订单数据进行检验,用筛除脏数据后的交易订单进行参数调整,优化过滤网模型的检测效果;所述建立配送费预测模型步骤:将单调正相关过滤网模型检测出的异常订单样本进行人工核验,查找分析订单异常的原因与合理性,通过比较两者覆盖率初步确定过滤网检测方法的效果,其覆盖度的定义如下: 通过控制变量法,使用同一份数据通过两种方式:1直接建立配送费预测的回归模型;2先基于数据建立过滤网模型并筛除异常交易样本,再建模配送费预测模型,对比两次回归模型下预测配送费的准确度Accuracy,判断出过滤网模型的必要性与有效性;使用Xgboost模型作为配送费预测模型的回归器,定义模型预测效果的评价指标MAPE: 当α∈[0,0.5时,对预测值偏大的样本的惩罚比预测值偏小的样本的惩罚更大;当α=0.5时,对预测值偏小的样本的惩罚与预测值偏大的样本的惩罚一样;当α=0.5,1]时,对预测值偏小的样本的惩罚比预测值偏大的样本的惩罚更大;对于第i条样本,其MAPE值为MAPEi,定义准确度Accuracy为MAPEi小于某一阈值所占比例,即 其中,I·为示性函数,N为样本量,β表示最大可容忍的相对误差,是评价准确度的阈值;β越小表示对模型预测效果的评价更严苛,β一般可取5%、10%、20%、30%等;经实验证明,使用剔除异常交易的数据建立配送费预测模型,可得到更高的准确度Accuracy,进一步说明了通过过滤网模型剔除异常样本的必要性与有效性。

全文数据:

权利要求:

百度查询: 上海品见智能科技有限公司 一种通过建立单调正相关过滤网的异常物流订单检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。