申请/专利权人:第四范式(北京)技术有限公司
申请日:2016-10-09
公开(公告)日:2024-04-12
公开(公告)号:CN113610239B
主分类号:G06N20/00
分类号:G06N20/00
优先权:["20160927 CN 2016108574253"]
专利状态码:有效-授权
法律状态:2024.04.12#授权;2021.11.23#实质审查的生效;2021.11.05#公开
摘要:提供了一种针对机器学习的特征处理方法及特征处理系统,其中,所述特征处理方法包括:A获取数据记录,其中,所述数据记录包括至少一个属性信息;B针对基于所述至少一个属性信息之中的至少一部分属性信息产生的连续特征之中的每一个连续特征,执行基本分箱运算和至少一个附加运算,以产生与所述每一个连续特征对应的基本分箱特征和至少一个附加特征;C产生至少包括所产生的基本分箱特征和至少一个附加特征的机器学习样本。通过上述方式,可获得与连续特征相应的包括分箱特征的多个特征,使得组成机器学习样本的特征更为有效,从而提升了机器学习模型的效果。
主权项:1.一种针对文本数据的特征处理方法,包括:(A)获取数据记录,其中,所述数据记录包括至少一个属性信息,所述数据记录为文本数据;(B)针对基于所述至少一个属性信息之中的至少一部分属性信息产生的连续特征之中的每一个连续特征,执行基本分箱运算和至少一个附加运算,以产生与所述每一个连续特征对应的基本分箱特征和至少一个附加特征;(C)产生至少包括所产生的基本分箱特征和至少一个附加特征的机器学习样本;(D)将所述机器学习样本输入机器学习模型以执行预测处理,提取与所述机器学习样本相应的预测结果。
全文数据:
权利要求:
百度查询: 第四范式(北京)技术有限公司 针对机器学习的特征处理方法及特征处理系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。