买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于潜客挖掘系统的数据清洗方法_天翼云科技有限公司_202311708488.9 

申请/专利权人:天翼云科技有限公司

申请日:2023-12-13

公开(公告)日:2024-04-09

公开(公告)号:CN117851753A

主分类号:G06F18/10

分类号:G06F18/10;G06F18/2413;G06N20/00

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明公开了一种基于潜客挖掘系统的数据清洗方法,属于大数据领域,通过使用数据去超速算法、数据去乒乓算法、顾客识别算法对数据进行处理,更贴近于实际的应用场景,应用于中国电信云计算公司大数据事业部房地产项目平台,是该平台的核心算法模型,为平台系统提供了基础的数据;利用用户基站位置异常数据进行算法分析、判断、清洗,对因信号强弱、地形变化导致的用户位置不稳定、位置变化异常进行无监督学习,清洗效率快、粒度细;结合数据清洗对用户位置重定位,在顾客识别过程中,提高位置精度、结合商场商圈位置数据提升识别精度;不同于车辆等物体数据飘移算法,本算法应用场景广泛,应用成本低,识别精度高。

主权项:1.一种基于潜客挖掘系统的数据清洗方法,其特征在于:应用于房地产平台商场商圈顾客判定上,具体包含超速数据清洗算法、乒乓切换清洗算法、顾客识别算法三种算法:其中,超速数据清洗算法,具体包含如下步骤;步骤A1,针对同一用户,顺次选取两条记录即第n条、第n+1条,根据第n条记录的停留时间TSn,以及与第n+1条记录的距离Dn,计算第n条记录的穿越速度,如果该穿越速度大于350kmh,则第n条记录的坐标修改为第n-1条记录的坐标,否则不作修改;其中,TSn为两停留点时间差;Dn为两记录点经纬度距离;步骤A2,如果为首条记录不合格,则继续计算第2条记录的速度,第2条记录与第3条记录的距离D2,直到找到速度合格的记录,将其坐标赋予首条记录;步骤A3,最后一条记录始终保留;步骤A4,重复步骤A2;步骤A5,删除重复记录。

全文数据:

权利要求:

百度查询: 天翼云科技有限公司 一种基于潜客挖掘系统的数据清洗方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。