买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】再犯罪风险预警混合属性数据处理方法、介质和设备_华南农业大学_202110403536.8 

申请/专利权人:华南农业大学

申请日:2021-04-15

公开(公告)日:2024-01-23

公开(公告)号:CN113159155B

主分类号:G06F18/2413

分类号:G06F18/2413;G06F18/23;G06F18/214;G06Q50/26

优先权:

专利状态码:有效-授权

法律状态:2024.01.23#授权;2021.08.10#实质审查的生效;2021.07.23#公开

摘要:本发明公开了一种再犯罪风险预警混合属性数据处理方法、介质和设备,首先获取数据样本构成数据集,对数据集中的各样本进行初步的数据预处理,剔除数据集中的冗余项和缺失项,然后将数据集转换为协调的数据集;接着对于协调的数据集中的各条件属性,进行约简处理,删除协调的数据集中的冗余属性,得到属性约简后的数据集,最后对属性约简后的数据集进行聚类。本发明方法中,通过数据预处理和约简处理,能够将数据集中存在缺失的属性以及冗余的属性进行有效去除,因此可以有效降低数据的维度,实现对预警数据的有效处理分析,基于该方法获取到的数据,能够使得再犯罪风险预警的分类准确度更高以及分类的速度更快。

主权项:1.一种再犯罪风险预警混合属性数据处理方法,其特征在于,包括步骤:步骤S1、获取数据样本构成数据集;其中,样本包括有犯罪前科且再犯罪人员及有犯罪前科却不再犯罪人员;步骤S2、对数据集中的各样本进行初步的数据预处理,剔除数据集中的冗余项和缺失项,然后将数据集转换为协调的数据集;对于剔除冗余项和缺失项的数据集,首先判断其是否为协调的数据集,若否,则将其转换成协调的数据集,具体如下:步骤S21、针对于剔除冗余项和缺失项的数据集,确定是否存在条件属性取值完全相同的样本,若是,则表示数据集为不协调的数据集;步骤S22、将数据集中,条件属性取值完全相同的样本替换成一个样本,该替换得到的样本决策属性的值取为:上述条件属性取值完全相同的样本中,对应决策属性出现次数最多的值,从而转换得到协调的数据集;步骤S3、对于协调的数据集中的各条件属性,进行约简处理,删除协调的数据集中的冗余属性,得到属性约简后的数据集;对于协调的数据集中的各条件属性,进行约简处理的过程如下:步骤S31、对于协调的数据集中的每个条件属性,首先逐个判断每个条件属性删除后对决策属性是否满足单点分布以及删除每个条件属性前后数据集的等价类的个数是否相等;若删除条件属性后满足单点分布或者删除条件属性前后数据集的等价类个数相等,则判断对应条件属性为冗余属性;否则,则判断对应条件属性为非冗余属性;步骤S32、根据协调的数据集中的每个条件属性的判定结果,确定协调的数据集中的每个条件属性是否均为非冗余;若否,则删除被判定为冗余的条件属性,然后进入步骤S33;若是,则结束约简处理,得到约简处理后的数据集;步骤S33、针对于协调数据集中所保留的每个条件属性,重新逐个判断每个条件属性删除后对决策属性是否满足单点分布和或删除每个条件属性前后数据集的等价类的个数是否发生变化,以判定每个条件属性是否为冗余条件属性;然后返回步骤S32;步骤S4、针对于属性约简后的数据集,根据其中样本的连续型属性和分类型属性对样本进行聚类,定义获取到的聚类数目为N,N为常量,即属性约简后的数据集中所有样本被聚类为N类。

全文数据:

权利要求:

百度查询: 华南农业大学 再犯罪风险预警混合属性数据处理方法、介质和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。