买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于推理技术的数据挖掘的方法_上海硕恩网络科技股份有限公司_202110726652.3 

申请/专利权人:上海硕恩网络科技股份有限公司

申请日:2021-06-29

公开(公告)日:2024-03-22

公开(公告)号:CN113515558B

主分类号:G06F16/2458

分类号:G06F16/2458;G06F16/215;G06F16/28;G06F16/36;G06N5/04;G06N5/046;G06N5/022;G06F21/62;G06F21/60

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2022.05.13#实质审查的生效;2021.10.19#公开

摘要:本发明属于推理技术的数据挖掘技术领域,尤其涉及基于推理技术的数据挖掘的方法,设立数据库云盘,将数据库云盘设置自动收集模块、分拣模块和加密模块,通过数据库云盘的自动收集模块自动在全网自动收集需要挖掘的数据相关信息,收集好的相关数据通过分拣模块进行快速的分类和识别,分拣模块将根据日期时间和数据种类进行快速的分类。该基于推理技术的数据挖掘的方法,能够通过建立数据库初期,通过自动收集模块、分拣模块、加密模块、展示模块、删改模块、恢复模块、屏蔽模块、分类模块和识别模块,就能对手机的数据进行初步的挖掘和整理,便于后期在收集数据的基础上进行挖掘,能够有效的初步达到数据挖掘结果针对性好的目的。

主权项:1.基于推理技术的数据挖掘的方法,其特征在于,包括以下步骤:S1、构建数据库设立数据库云盘,将数据库云盘设置自动收集模块、分拣模块和加密模块,通过数据库云盘的自动收集模块自动在全网自动收集需要挖掘的数据相关信息,收集好的相关数据通过分拣模块进行快速的分类和识别,分拣模块将根据日期时间和数据种类进行快速的分类,分类完成后分拣模块将分类好的数据中无效、错误和不能使用的数据进行删除和修改,从而再通过加密模块将处理后的数据进行快速的加密最终储存在数据库内;S2、检索初步挖掘数据进行挖掘数据输时,根据提供的第一关键数据和第二关键数据在数据库内进行检索,从而根据数据库提供的相关联的数据进行初步的筛选,筛选后得到的初步挖掘出来的数据,建立权重积分模型,根据权重积分模型得到相对重要的关键数据;S3、挖掘处理数据根据步骤S2中得到的关键数据将其通过MapReduce处理,通过指定关键输用来处理键值对KeyValue的map函数来生成一个中间键值对集合,然后,再指定一个reduce函数,它用来合并所有的具有相同中间key的中间value,得到相应的数据处理结果;S4、推理挖掘数据根据步骤S3作用得到的MapReduce处理数据处理结果,在通过步骤S2从而数据库内得到一个反向的关键数据,在将得到的反向的关键数据输入到步骤S3中进行MapReduce处理得到一个相应的反向数据处理结果,将得到的数据和反向数据建立一个中心图形和周边图形元素,根据得到的中心图形元素和周边图形元素进行分析,从而得到最终推理的数据,即为最终需要挖掘的数据;S5、知识图谱推理对数据壳内的数据建立正常的正向数据检索挖掘和反向的反向数据挖掘,在正向数据检索挖掘过程中,通过正向数据推理数据挖掘和反向符号推理挖掘,对数据建立双向的推理挖掘,当数据挖掘到后结束,当数据没有挖掘到查找出问题,进行排难处理并同时解决困难,困难解决后如果数据正常挖掘到后结束,在反向数据检索挖掘过程中,通过反向数据推理和反向子模块推理对数据进行挖掘,反向数据挖掘到将其移动至正向数据检索挖掘,从而得到挖掘数据并结束,未挖掘到查找出问题,进行排难处理并同时解决困难,从而挖掘出数据;S6、建模根据特征变量库构建特征变量宽表,进行同质性检查,再对特征变量变量过滤,过滤完成后进行变量粗选,然后进行WOEIV计算、相关性计算和PSI计算,同时可以直接根据特征变量宽表进行计算,计算得到的结果进行筛选,筛选后得到建模宽表,再根据建模宽表进行样本排除,排出后通过变量分箱,再根据变量分箱进行模型训练和自动模型生成。

全文数据:

权利要求:

百度查询: 上海硕恩网络科技股份有限公司 基于推理技术的数据挖掘的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。