买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】冒用账户识别方法、装置、电子设备及存储介质_创新先进技术有限公司_201811525692.6 

申请/专利权人:创新先进技术有限公司

申请日:2018-12-13

公开(公告)日:2023-04-28

公开(公告)号:CN110046783B

主分类号:G06Q10/0635

分类号:G06Q10/0635;G06Q50/26

优先权:

专利状态码:有效-授权

法律状态:2023.04.28#授权;2019.08.16#实质审查的生效;2019.07.23#公开

摘要:本公开实施例公开了冒用账户识别方法、装置、电子设备及存储介质。其中,所述方法包括:获取多个样本账户的账户地址冲突变量;利用评分卡模型对账户地址冲突变量进行评分,并根据得到的账户地址冲突变量的WOE值确定样本账户的样本学习评分值;根据账户地址冲突变量的重要程度以及WOE值对样本学习评分值进行修正,以获得样本学习评分修正值;根据样本账户是否被冒用的已知结果、样本学习评分值和样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得第一目标取值区间和第二目标取值区间所覆盖的样本账户中冒用账户的比例能够达到预设比例。本公开实施例,能够快速准确识别账户的冒用风险,提升了账户冒用的识别性能。

主权项:1.一种冒用账户识别方法,其特征在于,包括:获取多个样本账户的账户地址冲突变量;其中,所述账户地址冲突变量包括以下至少之一:标识所述样本账户的同账户身份相关的位置要素与同账户操作者相关的位置要素之间冲突的第一类变量;标识所述样本账户的同账户操作者相关的位置要素与同账户操作者相关的位置要素之间冲突的第二类变量;标识所述样本账户的同账户操作者相关的位置要素与同身份不同账户身份相关的位置要素之间冲突的第三类变量;根据评分卡模型中的变量处理方式得到所述账户地址冲突变量的WOE值,并根据所述WOE值确定所述样本账户的样本学习评分值;根据所述账户地址冲突变量的重要程度以及所述WOE值对所述样本学习评分值进行修正,以获得样本学习评分修正值;根据所述样本账户是否被冒用的已知结果、所述样本学习评分值和所述样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得所述第一目标取值区间和第二目标取值区间所覆盖的所述样本账户中冒用账户的比例能够达到预设比例。

全文数据:冒用账户识别方法、装置、电子设备及存储介质技术领域本公开涉及互联网技术领域,具体涉及一种冒用账户识别方法、装置、电子设备及存储介质。背景技术身份冒用可以理解为黑产通过批量收集全国各地的身份信息,利用手上掌握的身份核验资料,伪冒他人身份在互联网上进行非面签的认证操作。资源的有限性及成本利润率限制,导致黑产无法逐一奔赴各地、为被冒用的身份伪造一整套高仿信息,则认证材料和身份信息相互之间的位置属性存在一定的冲突性。伪冒他人信息进行认证的账户为身份冒用账户,精准识别冒用账户,对于风控、信贷等业务有重要价值。比如,很多信贷大额逾期不还账户是伪冒账户账户黑产一般不会透支自己的信用、因此会使用他人被冒用的账户、透支他人信用、套取信用价值,且可大批量套取。身份冒用账户可以通过位置属性冲突识别系统,识别黑产收集全国各地信息进行认证的冒用账户,并将结果保存下来。识别结果可以用于:1.主动提高认证账户的准入门槛;2.在其他业务场景下,比如信贷准入、商户签约、营销活动作弊风险防控中,提供结果风险咨询。基于位置属性冲突的账户评分,目前主要有以下两种方式:身份冒用模型评分:除了位置属性冲突外,还会结合用户的行为特征、关系网络建立多维特征体系,通过数据挖掘建模,评估账户冒用的可能性;盗用位置冲突评分:考虑账户使用者的交替变化,来识别账户被盗的风险。本公开发明人发现,基于位置属性冲突的账户评分的上述两类方式具有如下缺陷:身份冒用模型评分:综合考虑各方因素进行评分,可解释性较差,且因依赖数据庞大复杂,分数无法实时产出,无法满足身份冒用实时防控的需求、和衍生风险防控要求可解释性的需求。盗用位置冲突评分:考虑账户使用者的交替变化,来识别账户被盗的风险。对于冒用账户而言,账户一直处于黑产手中,不存在使用者的变化,无法描述账户被冒用的风险。发明内容本公开实施例提供一种冒用账户识别方法、装置、电子设备及计算机可读存储介质。第一方面,本公开实施例中提供了一种冒用账户识别方法。具体的,所述冒用账户识别方法,包括:获取多个样本账户的账户地址冲突变量;根据评分卡模型中的变量处理方式得到所述账户地址冲突变量的WOE值,并根据所述WOE值确定所述样本账户的样本学习评分值;根据所述账户地址冲突变量的重要程度以及所述WOE值对所述样本学习评分值进行修正,以获得样本学习评分修正值;根据所述样本账户是否被冒用的已知结果、所述样本学习评分值和所述样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得所述第一目标取值区间和第二目标取值区间所覆盖的所述样本账户中冒用账户的比例能够达到预设比例。进一步地,所述账户地址冲突变量包括以下至少之一:标识所述样本账户的同账户身份相关的位置要素与同账户操作者相关的位置要素之间冲突的第一类变量;标识所述样本账户的同账户操作者相关的位置要素与同账户操作者相关的位置要素之间冲突的第二类变量;标识所述样本账户的同账户操作者相关的位置要素与同身份不同账户身份相关的位置要素之间冲突的第三类变量。进一步地,所述根据评分卡模型中的变量处理方式得到所述账户地址冲突变量的WOE值,并根据所述WOE值确定所述样本账户的样本学习评分值,包括:利用评分卡模型中的变量处理方式确定所述账户地址冲突变量的WOE值以及IV值;根据所述IV值从所述账户地址冲突变量中筛选出至少一个特征显著变量;根据所述特征显著变量的WOE值确定所述样本账户的所述样本学习评分值。进一步地,所述根据所述账户地址冲突变量的重要程度以及所述WOE值对所述样本学习评分值进行修正,以获得样本学习评分修正值,包括:确定所述特征显著变量的权重值;利用所述权重值对所述特征显著变量的WOE值进行加权后确定所述样本学习评分修正值。进一步地,所述根据所述样本账户是否被冒用的已知结果、所述样本学习评分值和所述样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得所述第一目标取值区间和第二目标取值区间所覆盖的所述样本账户中冒用账户的比例能够达到预设比例,包括:根据多个所述样本账户的所述已知结果、所述样本学习评分值和所述样本学习评分修正值确定多个候选取值区间对;其中,每个候选取值区间对包括第一候选取值区间和第二候选取值区间,且所述样本学习评分值在所述候选取值区间对中的所述第一候选取值区间中、所述样本学习评分修正值在所述候选取值区间对中的所述第二目标取值区间的所述样本账户中冒用账户的占比达到所述预设比例;从所述多个候选取值区间对中选择风险覆盖率最大的作为所述第一目标取值区间和第二目标取值区间。进一步地,所述冒用账户识别方法,还包括:确定待识别账户的待识别评分值和待识别评分修正值;根据所述待识别评分值、待识别评分修正值是否分别位于所述第一目标取值区间和第二目标取值区间中来确定所述待识别账户是否为冒用账户。进一步地,所述确定待识别账户的待识别学习评分值和待识别学习评分修正值,包括:确定所述待识别账户的账户地址冲突变量的WOE值;根据所述待识别账户的账户地址冲突变量的WOE值确定所述待识别评分值,进而根据所述待识别账户的账户地址冲突变量的WOE值以及所述待识别账户的账户地址冲突变量的重要性确定所述待识别评分修正值。第二方面,本公开实施例中提供了一种冒用账户识别装置。具体的,所述冒用账户识别装置,包括:获取模块,被配置为获取多个样本账户的账户地址冲突变量;第一确定模块,被配置为根据评分卡模型中的变量处理方式得到所述账户地址冲突变量的WOE值,并根据所述WOE值确定所述样本账户的样本学习评分值;修正模块,被配置为根据所述账户地址冲突变量的重要程度以及所述WOE值对所述样本学习评分值进行修正,以获得样本学习评分修正值;第二确定模块,被配置为根据所述样本账户是否被冒用的已知结果、所述样本学习评分值和所述样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得所述第一目标取值区间和第二目标取值区间所覆盖的所述样本账户中冒用账户的比例能够达到预设比例。进一步地,所述账户地址冲突变量包括以下至少之一:标识所述样本账户的同账户身份相关的位置要素与同账户操作者相关的位置要素之间冲突的第一类变量;标识所述样本账户的同账户操作者相关的位置要素与同账户操作者相关的位置要素之间冲突的第二类变量;标识所述样本账户的同账户操作者相关的位置要素与同身份不同账户身份相关的位置要素之间冲突的第三类变量。进一步地,所述第一确定模块,包括:第一确定子模块,被配置为利用评分卡模型中的变量处理方式确定所述账户地址冲突变量的WOE值以及IV值;筛选子模块,被配置为根据所述IV值从所述账户地址冲突变量中筛选出至少一个特征显著变量;第二确定子模块,被配置为根据所述特征显著变量的WOE值确定所述样本账户的所述样本学习评分值。进一步地,所述修正模块,包括:第三确定子模块,被配置为确定所述特征显著变量的权重值;第四确定子模块,被配置为利用所述权重值对所述特征显著变量的WOE值进行加权后确定所述样本学习评分修正值。进一步地,所述第二确定模块,包括:第五确定子模块,被配置为根据多个所述样本账户的所述已知结果、所述样本学习评分值和所述样本学习评分修正值确定多个候选取值区间对;其中,每个候选取值区间对包括第一候选取值区间和第二候选取值区间,且所述样本学习评分值在所述候选取值区间对中的所述第一候选取值区间中、所述样本学习评分修正值在所述候选取值区间对中的所述第二目标取值区间的所述样本账户中冒用账户的占比达到所述预设比例;第六确定子模块,被配置为从所述多个候选取值区间对中选择风险覆盖率最大的作为所述第一目标取值区间和第二目标取值区间。进一步地,所述冒用账户识别装置,还包括:第三确定模块,被配置为确定待识别账户的待识别评分值和待识别评分修正值;第四确定模块,被配置为根据所述待识别评分值、待识别评分修正值是否分别位于所述第一目标取值区间和第二目标取值区间中来确定所述待识别账户是否为冒用账户。进一步地,所述第三确定模块,包括:确定所述待识别账户的账户地址冲突变量的WOE值;根据所述待识别账户的账户地址冲突变量的WOE值确定所述待识别评分值,进而根据所述待识别账户的账户地址冲突变量的WOE值以及所述待识别账户的账户地址冲突变量的重要性确定所述待识别评分修正值。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,冒用账户识别装置的结构中包括存储器和处理器,所述存储器用于存储一条或多条支持冒用账户识别装置执行上述第一方面中冒用账户识别方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。所述冒用账户识别装置还可以包括通信接口,用于冒用账户识别装置与其他设备或通信网络通信。第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现第一方面所述的方法步骤。第四方面,本公开实施例提供了一种计算机可读存储介质,用于存储冒用账户识别装置所用的计算机指令,其包含用于执行上述第一方面中冒用账户识别方法所涉及的计算机指令。本公开实施例提供的技术方案可以包括以下有益效果:本公开实施例通过获取样本账户的账户冲突特征变量,并利用评分卡模型对账户冲突特征变量进行评分,进而得到样本账户的样本学习评分值,同时还对样本学习评分值根据账户地址冲突变量的重要程度进行修正,得到样本学习评分修正值,之后再根据样本账户为是否冒用账户的结果以及上述样本学习评分值和样本学习评分修正值找到一个目标取值区间对,使得样本学习评分值和样本学习评分修正值落入该目标取值区间对的样本账户的冒用账户识别率达到预设阈值。通过本公开实施例确定的目标取值区间对可以对待识别账户进行实时风险评分,能够快速准确识别账户的冒用风险,便于业务反应及衍生风险识别的快速接收信息;同时本公开实施例在确定目标取值区间对的过程中采取样本学习和专家经验修正结合的实时评分组合方式,极大地提升了账户冒用的识别性能。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。在附图中:图1示出根据本公开一实施方式的冒用账户识别方法的流程图;图2示出根据图1所示实施方式的步骤S102的流程图;图3示出根据图1所示实施方式的步骤S103的流程图;图4示出根据图1所示实施方式的步骤S104的流程图;图5示出根据本公开另一实施方式的冒用账户识别方法的流程图;图6示出根据图5所示实施方式的步骤S501的流程图;图7示出根据本公开一实施方式的冒用账户识别装置的结构框图;图8示出根据图7所示实施方式的第一确定模块702的结构框图;图9示出根据图7所示实施方式的修正模块703的结构框图;图10示出根据图7所示实施方式的第二确定模块704的结构框图;图11示出根据本公开另一实施方式的冒用账户识别装置的结构框图;图12示出根据图11所示实施方式的第三确定模块1101的结构框图;图13是适于用来实现根据本公开一实施方式的冒用账户识别方法的电子设备的结构示意图。具体实施方式下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。图1示出根据本公开一实施方式的冒用账户识别方法的流程图。如图1所示,所述冒用账户识别方法包括以下步骤S101-S104:在步骤S101中,获取多个样本账户的账户地址冲突变量;在步骤S102中,根据评分卡模型中的变量处理方式得到所述账户地址冲突变量的WOE值,并根据所述WOE值确定所述样本账户的样本学习评分值;在步骤S103中,根据所述账户地址冲突变量的重要程度以及所述WOE值对所述样本学习评分值进行修正,以获得样本学习评分修正值;在步骤S104中,根据所述样本账户是否被冒用的已知结果、所述样本学习评分值和所述样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得所述第一目标取值区间和第二目标取值区间所覆盖的所述样本账户中冒用账户的比例能够达到预设比例。本实施例中,账户地址冲突变量是指账户相关的一系列预设位置要素中,表示两两预设位置要素之间是否发生冲突的变量,并且该两两预设位置要素之间发生冲突能够表示该账户存在被冒用的风险;例如用于表示同一账户的用户当前的地址与该账户的当前登录地址之间是否发生冲突的变量。账户地址冲突是指两两地址应当相同、但实际上并不相同。由于同一账户相关的预设位置要素较多,例如表示该同一账户的用户当前位置、历史位置、常见位置等多个位置要素,同一账户的各个登录位置、同身份不同账户涉及的各个位置要素等,因此可以确定哪些位置要素之间发生冲突会导致账户冒用风险,进而针对这些位置要素预先构造账户地址冲突变量。样本账户的账户地址冲突变量可以通过收集网络中各个样本账户在一段时间周期内的各个预设位置要素,进而确定预先构造的账户地址冲突变量的值,构造账户地址冲突变量的取值方式可以包括多种,例如账户地址冲突变量A中的两预设位置要素之间发生了冲突,则可以将账户地址冲突变量A置为1或0等,另外还可以将样本账户的多个账户地址冲突变量进行分类,统计每一类中多个账户地址冲突变量中两两地址要素之间发生冲突的个数正整数作为该类账户地址冲突变量的取值,或者统计每一类中两两地址要素之间发生冲突的账户地址冲突变量在该类中所有账户地址冲突变量中所占的比例如0-100%。在获取到了所有样本账户的多个账户地址冲突变量后,可以通过评分卡模型的变量处理方式对这些账户地址冲突变量进行评分,进而得到每个账户地址冲突变量在各个WOE分箱中的WOE值,并进一步根据WOE值确定每个样本账户的样本学习评分值。在一实施例中,每个样本账户的样本学习评分值为该样本账户的各账户地址冲突变量所在分箱的WOE值之和。评分卡模型是一种较为成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量的WOE编码方式离散化之后运用logistic回归模型进行的一种二分类变量的广义线性模型。WOE叫做证据权重WeightofEvidence,表示模型变量取某个值的时候对违约比例的一种影响。评分卡模型被应用到本公开实施例中后,模型变量为本公开实施例中的账户地址冲突变量,账户地址冲突变量的WOE分箱操作可以通过对同一样本账户中账户地址冲突变量的取值范围进行离散化,也即划分成不同的区间;例如,账户地址冲突变量取值为离散的,如0或1,则可以划分为两个区间也即两个WOE分箱,即0或1;而如果账户地址冲突变量的取值为连续的比例范围,例如同一账户中一类账户地址冲突变量的取值范围为两两位置要素发生冲突的账户地址冲突变量在该类所有账户地址冲突变量中所占的比例范围,则可以预先设定该比例的最小比例0和最大比例100%,并对最小比例至最大比例这个范围进行离散化,也即划分成多个不同的区间,也即多个WOE分箱,如0~30%、30%~50%、50%~100%三个WOE分箱;账户地址冲突变量的取值范围还可以为同一样本账户中一类账户地址冲突变量中两两位置要素发生冲突的账户地址冲突变量个数,则可以设定一最大个数,并对最小个数至最大个数这个范围进行离散化,也即划分成多个不同的区间,也即多个WOE分箱。WOE分箱操作为本领域中的已知技术,在此不再赘述。账户地址冲突变量的WOE值的计算可以通过如下公式进行:其中,WOEi为当前账户地址冲突变量在第i个WOE分箱的WOE值,pyi为多个样本账户的当前账户地址冲突变量的值位于第i个WOE分箱,且发生冲突的样本账户个数占总样本账户个数的比例,pni为多个样本账户的当前账户地址冲突变量的值位于第i个WOE分箱,且未发生冲突的样本账户个数占总样本账户个数的比例,#yi为多个样本账户的当前账户地址冲突变量的值位于第i个WOE分箱,且发生冲突的样本账户个数,#ni为多个样本账户的当前账户地址冲突变量的值位于第i个WOE分箱,且未发生冲突的样本账户个数,#yT为多个样本账户的当前账户地址冲突变量中发生冲突的个数,#nT为多个样本账户的当前账户地址冲突变量中未发生冲突的个数。通过上述公式可以计算出每个账户地址冲突变量对应的WOEi,样本账户的每个账户地址冲突变量的WOE值实际上是该账户地址冲突变量的值所在WOE分箱对应的WOEi。样本账户的样本学习评分值可以基于WOEi确定,例如可以将样本账户的每个账户地址冲突变量所在WOE分箱对应的WOEi进行加和得到。样本学习评分修正值可以是对样本账户的账户地址冲突变量对应的WOE值进行加权后得到的,例如可以针对账户地址冲突变量的重要性设置一权重系数,进而将该权重系数与该账户地址冲突变量的WOE值相乘后再加和确定样本学习评分修正值。账户地址冲突变量的重要性可以依据专家经验确定,例如账户地址冲突变量1依据业务专家经验认为比较重要,则权重可设为100,而账户地址冲突变量2依据业务专家经验认为重要性没有特征1那么强,则权重可设为10。样本账户通常是从历史数据中收集的,例如可以收集被黑产用户冒用的账户作为负样本账户,还可以收集一些正常用户的账户等作为正样本账户,因此这些样本账户是否被冒用是已知的,也即所述样本账户是否被冒用的已知结果用于表示该样本账户是否被冒用。根据该已知结果、每个样本账户的样本学习评分值以及样本学习评分修正值确定的第一目标取值区间和第二目标取值区间分别对应样本学习评分值和样本学习评分修正值,通过多个样本账户的这些样本学习评分值和样本学习评分修正值可以统计冒用账户识别准确率达到预设比例的第一目标取值区间和第二目标取值区间的组合,冒用账户识别准确率为同时在第一目标取值区间和第二目标取值区间的样本账户中冒用账户所占的比例。预设比例可以根据实际情况以及风险控制力度预先设置,例如可以设置为99%。第一目标取值区间和第二目标取值区间确定后,可以利用第一目标取值区间和第二目标取值区间进行在线识别,在当前识别账户评分值和修正评分值分别落入第一目标取值区间和第二目标取值区间时,则可以认为该当前识别账户为风险账户,也即被冒用的账户,可以进行后续的相关处理。本公开实施例通过获取样本账户的账户冲突特征变量,并利用评分卡模型对账户冲突特征变量进行评分,进而得到样本账户的样本学习评分值,同时还对样本学习评分值根据账户地址冲突变量的重要程度进行修正,得到样本学习评分修正值,之后再根据样本账户为是否冒用账户的结果以及上述样本学习评分值和样本学习评分修正值找到一个目标取值区间对,使得样本学习评分值和样本学习评分修正值落入该目标取值区间对的样本账户的冒用账户识别率达到预设阈值。通过本公开实施例确定的目标取值区间对可以对待识别账户进行实时风险评分,能够快速准确识别账户的冒用风险,便于业务反应及衍生风险识别的快速接收信息;同时本公开实施例在确定目标取值区间对的过程中采取样本学习和专家经验修正结合的实时评分组合方式,极大地提升了账户冒用的识别性能。在本实施例的一个可选实现方式中,所述账户地址冲突变量包括以下至少之一:标识所述样本账户的同账户身份相关的位置要素与同账户操作者相关的位置要素之间冲突的变量;标识所述样本账户的同账户操作者相关的位置要素与同账户操作者相关的位置要素之间冲突的变量;标识所述样本账户的同账户操作者相关的位置要素与同身份不同账户身份相关的位置要素之间冲突的变量。该可选的实现方式中,同账户身份相关的位置要素包括但不限于账户认证身份的户籍地等,同账户操作者相关的位置要素包括但不限于当前操作该账户的操作者相关的位置如IP地址等、操作者所使用介质关联位置如手机定位地址、sim卡定位地址、认证银行卡发卡行归属地等,同身份不同账户身份相关的位置要素包括但不限于拥有该账户的用户的其他账户所涉及的一系列位置要素等。当然,账户地址冲突变量不限于上述三类变量,具体可以根据实际情况以及技术的发展进行扩展。在本实施例的一个可选实现方式中,如图2所示,所述步骤S102,即根据评分卡模型中的变量处理方式得到所述账户地址冲突变量的WOE值,并根据所述WOE值确定所述样本账户的样本学习评分值的步骤,进一步包括以下步骤S201-S203:在步骤S201中,利用评分卡模型中的变量处理方式确定所述账户地址冲突变量的WOE值以及IV值;在步骤S202中,根据所述IV值从所述账户地址冲突变量中筛选出至少一个特征显著变量;在步骤S203中,根据所述特征显著变量的WOE值确定所述样本账户的所述样本学习评分值。该可选的实现方式中,IVInformationValue值通常称为信息值,可以用于表示账户地址冲突变量的重要性。IV值可以根据WOE分箱后每个分箱下账户地址冲突变量的WOE值来确定,具体可根据如下公式计算:其中,IVi为当前账户地址冲突变量在第i个WOE分箱的IV值,n为WOE分箱后的分箱个数,IV为当前账户地址冲突变量的IV值。由于IV值能够表征账户地址冲突变量的重要程度,因此可以根据账户地址冲突变量的IV值对账户地址冲突变量的重要性进行排序,并保留较为重要的一部分账户地址冲突变量来计算样本学习评分值和样本学习评分修正值,而剔除不重要的另一部分账户地址冲突变量,减少对评分结果的干扰。显著特征变量就是所有账户地址冲突变量中较为重要的一部分,可以通过预先设定的阈值确定,也即将IV值大于阈值的账户地址冲突变量选定为显著特征变量;该阈值可以根据经验等来设置,在此不做限制。在本实施例的一个可选实现方式中,如图3所示,所述步骤S103,即根据所述账户地址冲突变量的重要程度以及所述WOE值对所述样本学习评分值进行修正,以获得样本学习评分修正值的步骤,进一步包括以下步骤S301-S302:在步骤S301中,确定所述特征显著变量的权重值;在步骤S302中,利用所述权重值对所述特征显著变量的WOE值进行加权后确定所述样本学习评分修正值。该可选的实现方式中,可以根据专家经验和或以往的历史数据等确定账户地址冲突变量中特征显著变量的权重值,并根据权重值对特征显著变量的WOE值进行加权后确定样本学习评分修正值。在一实施例中,样本账户的样本学习评分修正值可以通过将多个显著特征变量的WOE值与对应的权重值相乘后相加得到样本学习评分修正值。在本实施例的一个可选实现方式中,如图4所示,所述步骤S104,即根据所述样本账户是否被冒用的已知结果、所述样本学习评分值和所述样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得所述第一目标取值区间和第二目标取值区间所覆盖的所述样本账户中冒用账户的比例能够达到预设比例的步骤,进一步包括以下步骤S401-S402:在步骤S401中,根据多个所述样本账户的所述已知结果、所述样本学习评分值和所述样本学习评分修正值确定多个候选取值区间对;其中,每个候选取值区间对包括第一候选取值区间和第二候选取值区间,且所述样本学习评分值在所述候选取值区间对中的所述第一候选取值区间中、所述样本学习评分修正值在所述候选取值区间对中的所述第二目标取值区间的所述样本账户中冒用账户的占比达到所述预设比例;在步骤S402中,从所述多个候选取值区间对中选择风险覆盖率最大的作为所述第一目标取值区间和第二目标取值区间。该可选的实现方式中,可以对样本学习评分值和样本学习评分修正值的最大取值范围进行区间划分,并找出区间内冒用账户比例达预设比例的候选取值区间对,例如,预设比例为99%,那么对于{样本学习分值大于等于10,样本学习修正分值大于等于190}的某个区间对A,样本学习分值大于等于10、且样本学习修正分值大于等于190的所有样本账户中99.5%的样本账户为冒用账户,那么可以将{样本学习分值大于等于10,样本学习修正分值大于等于190}区间对A设置为候选取值区间对。而对于{样本学习分值大于等于10,样本学习修正分值在130至190之间}的某个区间对B,样本学习分值大于等于10、且样本学习修正分值在130至190之间的所有样本账户中99%的样本账户为冒用账户,那么区间对B也可以设置为候选取值区间对。预设比例可以认为是冒用账户的识别准确率,也即本公开所选取的第一候选取值区间或第一目标取值区间和第二候选取值区间或第二目标取值区间至少能够识别出预设比例的冒用账户。在一实施例中,候选取值区间对可以通过最优WOE分箱的方式进行。WOE分箱有三种:等频、等宽和最优。最优的WOE分箱方式是通过对样本学习评分值和样本学习评分修正值的取值区间进行离散化,也即进行区间划分,并通过计算每个区间中的样本学习评分值和样本学习评分修正值的WOE值,进而计算出样本学习评分值和样本学习评分修正值的IV值,通过IV值选出一种最优的分箱方式,并最终选出候选取值区间对。WOE的分箱方式为现有技术,在此不再赘述。该可选的实现方式中不但考虑冒用账户识别准确率这一条件,还考虑了风险覆盖率这一条件,通过从多个候选取值区间中选择风险覆盖率最大的一对作为第一目标取值区间和第二目标取值时间,以便冒用账户的识别准确率达到预设比例的基础上,使得风险覆盖率最大化。风险覆盖率为样本学习评分值在第一目标取值区间、且样本学习评分修正值在第二目标取值区间中的冒用账户占所有样本账户中所有冒用账户的比例。例如,对于上述候选区间对A,假如其风险覆盖率为7%,而候选区间对B,假如其风险覆盖率为17%,那么可以选择候选区间对B中的第一候选取值区间为第一目标取值区间,第二候选取值区间为第二目标取值区间。在本实施例的一个可选实现方式中,如图5所示,所述方法进一步还包括以下步骤S501-S502:在步骤S501中,确定待识别账户的待识别评分值和待识别评分修正值;在步骤S502中,根据所述待识别评分值、待识别评分修正值是否分别位于所述第一目标取值区间和第二目标取值区间中来确定所述待识别账户是否为冒用账户。该可选的实现方式中,在确定了第一目标取值区间和第二目标取值区间后,可以进行在线识别。在线识别过程中,对于待识别账户先确定其待识别学习评分值和待识别学习评分修正值,待识别账户的待识别评分值和待识别评分修正值的计算方式分别与样本账户的样本学习评分值和样本学习评分修正值相同;之后再根据待识别账户的待识别评分值和待识别评分修正值是否同时位于第一目标取值区间和第二目标取值区间来确定所述待识别账户是否为冒用账户,也即待识别账户是否被他人冒用,而不是与待识别账户的身份一致的用户使用。在本实施例的一个可选实现方式中,如图6所示,所述步骤S501,即确定待识别账户的待识别学习评分值和待识别学习评分修正值的步骤,进一步包括以下步骤S601-S602:在步骤S601中,确定所述待识别账户的账户地址冲突变量的WOE值;在步骤S602中,根据所述待识别账户的账户地址冲突变量的WOE值确定所述待识别评分值,进而根据所述待识别账户的账户地址冲突变量的WOE值以及所述待识别账户的账户地址冲突变量的重要性确定所述待识别评分修正值。该可选的实现方式中,待识别账户的账户地址冲突变量的WOE值为该账户地址冲突变量的值所落入的WOE分箱的WOEi值,WOEi的值可以为图1所示实施例中根据样本账户的账户地址冲突变量确定的值。待识别账户的待识别评分值为待识别账户的所有账户地址冲突变量或者显著特征变量的WOE值累加得到,待识别评分修正值可以通过待识别账户的所有账户地址冲突变量或者显著特征变量的WOE值加权后累加得到,此处的加权是利用账户地址冲突变量或者显著特征变量的重要性进行加权。下述为本公开装置实施例,可以用于执行本公开方法实施例。图7示出根据本公开一实施方式的冒用账户识别装置的结构框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图7所示,所述冒用账户识别装置包括:获取模块701,被配置为获取多个样本账户的账户地址冲突变量;第一确定模块702,被配置为根据评分卡模型中的变量处理方式得到所述账户地址冲突变量的WOE值,并根据所述WOE值确定所述样本账户的样本学习评分值;修正模块703,被配置为根据所述账户地址冲突变量的重要程度以及所述WOE值对所述样本学习评分值进行修正,以获得样本学习评分修正值;第二确定模块704,被配置为根据所述样本账户是否被冒用的已知结果、所述样本学习评分值和所述样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得所述第一目标取值区间和第二目标取值区间所覆盖的所述样本账户中冒用账户的比例能够达到预设比例。本实施例中,账户地址冲突变量是指账户相关的一系列预设位置要素中,表示两两预设位置要素之间是否发生冲突的变量,并且该两两预设位置要素之间发生冲突能够表示该账户存在被冒用的风险;例如用于表示同一账户的用户当前的地址与该账户的当前登录地址之间是否发生冲突的变量。账户地址冲突是指两两地址应当相同、但实际上并不相同。由于同一账户相关的预设位置要素较多,例如表示该同一账户的用户当前位置、历史位置、常见位置等多个位置要素,同一账户的各个登录位置、同身份不同账户涉及的各个位置要素等,因此可以确定哪些位置要素之间发生冲突会导致账户冒用风险,进而针对这些位置要素预先构造账户地址冲突变量。样本账户的账户地址冲突变量可以通过收集网络中各个样本账户在一段时间周期内的各个预设位置要素,进而确定预先构造的账户地址冲突变量的值,构造账户地址冲突变量的取值方式可以包括多种,例如账户地址冲突变量A中的两预设位置要素之间发生了冲突,则可以将账户地址冲突变量A置为1或0等,另外还可以将样本账户的多个账户地址冲突变量进行分类,统计每一类中多个账户地址冲突变量中两两地址要素之间发生冲突的个数正整数作为该类账户地址冲突变量的取值,或者统计每一类中两两地址要素之间发生冲突的账户地址冲突变量在该类中所有账户地址冲突变量中所占的比例如0-100%。获取模块701在获取到了所有样本账户的多个账户地址冲突变量后,第一确定模块702可以通过评分卡模型中的变量处理方式对这些账户地址冲突变量进行评分,进而得到每个账户地址冲突变量在各个WOE分箱中的WOE值,并进一步根据WOE值确定每个样本账户的样本学习评分值。在一实施例中,每个样本账户的样本学习评分值为该样本账户的各账户地址冲突变量所在分箱的WOE值之和。评分卡模型是一种较为成熟的预测装置,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量的WOE编码方式离散化之后运用logistic回归模型进行的一种二分类变量的广义线性模型。WOE叫做证据权重WeightofEvidence,表示模型变量取某个值的时候对违约比例的一种影响。评分卡模型被应用到本公开实施例中,模型变量为本公开实施例中的账户地址冲突变量,账户地址冲突变量的WOE分箱操作可以通过对同一样本账户中账户地址冲突变量的取值范围进行离散化,也即划分成不同的区间;例如,账户地址冲突变量取值为离散的,如0或1,则可以划分为两个区间也即两个WOE分箱,即0或1;而如果账户地址冲突变量的取值为连续的比例范围,例如同一账户中一类账户地址冲突变量的取值范围为两两位置要素发生冲突的账户地址冲突变量在该类所有账户地址冲突变量中所占的比例范围,则可以预先设定该比例的最小比例0和最大比例100%,并对最小比例至最大比例这个范围进行离散化,也即划分成多个不同的区间,也即多个WOE分箱,如0~30%、30%~50%、50%~100%三个WOE分箱;账户地址冲突变量的取值范围还可以为同一样本账户中一类账户地址冲突变量中两两位置要素发生冲突的账户地址冲突变量个数,则可以设定一最大个数,并对最小个数至最大个数这个范围进行离散化,也即划分成多个不同的区间,也即多个WOE分箱。WOE分箱操作为本领域中的已知技术,在此不再赘述。账户地址冲突变量的WOE值的计算可以通过如下公式进行:其中,WOEi为当前账户地址冲突变量在第i个WOE分箱的WOE值,pyi为多个样本账户的当前账户地址冲突变量的值位于第i个WOE分箱,且发生冲突的样本账户个数占总样本账户个数的比例,pni为多个样本账户的当前账户地址冲突变量的值位于第i个WOE分箱,且未发生冲突的样本账户个数占总样本账户个数的比例,#yi为多个样本账户的当前账户地址冲突变量的值位于第i个WOE分箱,且发生冲突的样本账户个数,#ni为多个样本账户的当前账户地址冲突变量的值位于第i个WOE分箱,且未发生冲突的样本账户个数,#yT为多个样本账户的当前账户地址冲突变量中发生冲突的个数,#nT为多个样本账户的当前账户地址冲突变量中未发生冲突的个数。通过上述公式可以计算出每个账户地址冲突变量对应的WOEi,样本账户的每个账户地址冲突变量的WOE值实际上是该账户地址冲突变量的值所在WOE分箱对应的WOEi。样本账户的样本学习评分值可以基于WOEi确定,例如可以将样本账户的每个账户地址冲突变量所在WOE分箱对应的WOEi进行加和得到。样本学习评分修正值可以是对样本账户的账户地址冲突变量对应的WOE值进行加权后得到的,例如可以针对账户地址冲突变量的重要性设置一权重系数,进而将该权重系数与该账户地址冲突变量的WOE值相乘后再加和确定样本学习评分修正值。账户地址冲突变量的重要性可以依据专家经验确定,例如账户地址冲突变量1依据业务专家经验认为比较重要,则权重可设为100,而账户地址冲突变量2依据业务专家经验认为重要性没有特征1那么强,则权重可设为10。样本账户通常是从历史数据中收集的,例如可以收集被黑产用户冒用的账户作为负样本账户,还可以收集一些正常用户的账户等作为正样本账户,因此这些样本账户是否被冒用是已知的,也即所述样本账户是否被冒用的已知结果用于表示该样本账户是否被冒用。根据该已知结果、每个样本账户的样本学习评分值以及样本学习评分修正值确定的第一目标取值区间和第二目标取值区间分别对应样本学习评分值和样本学习评分修正值,通过多个样本账户的这些样本学习评分值和样本学习评分修正值可以统计冒用账户识别准确率达到预设比例的第一目标取值区间和第二目标取值区间的组合,冒用账户识别准确率为同时在第一目标取值区间和第二目标取值区间的样本账户中冒用账户所占的比例。预设比例可以根据实际情况以及风险控制力度预先设置,例如可以设置为99%。第一目标取值区间和第二目标取值区间确定后,可以利用第一目标取值区间和第二目标取值区间进行在线识别,在当前识别账户评分值和修正评分值分别落入第一目标取值区间和第二目标取值区间时,则可以认为该当前识别账户为风险账户,也即被冒用的账户,可以进行后续的相关处理。本公开实施例通过获取样本账户的账户冲突特征变量,并利用评分卡模型对账户冲突特征变量进行评分,进而得到样本账户的样本学习评分值,同时修正模块703还对样本学习评分值根据账户地址冲突变量的重要程度进行修正,得到样本学习评分修正值,之后第二确定模块704再根据样本账户为是否冒用账户的结果以及上述样本学习评分值和样本学习评分修正值找到一个目标取值区间对,使得样本学习评分值和样本学习评分修正值落入该目标取值区间对的样本账户的冒用账户识别率达到预设阈值。通过本公开实施例确定的目标取值区间对可以对待识别账户进行实时风险评分,能够快速准确识别账户的冒用风险,便于业务反应及衍生风险识别的快速接收信息;同时本公开实施例在确定目标取值区间对的过程中采取样本学习和专家经验修正结合的实时评分组合方式,极大地提升了账户冒用的识别性能。在本实施例的一个可选实现方式中,所述账户地址冲突变量包括以下至少之一:标识所述样本账户的同账户身份相关的位置要素与同账户操作者相关的位置要素之间冲突的变量;标识所述样本账户的同账户操作者相关的位置要素与同账户操作者相关的位置要素之间冲突的变量;标识所述样本账户的同账户操作者相关的位置要素与同身份不同账户身份相关的位置要素之间冲突的变量。该可选的实现方式中,同账户身份相关的位置要素包括但不限于账户认证身份的户籍地等,同账户操作者相关的位置要素包括但不限于当前操作该账户的操作者相关的位置如IP地址等、操作者所使用介质关联位置如手机定位地址、sim卡定位地址、认证银行卡发卡行归属地等,同身份不同账户身份相关的位置要素包括但不限于拥有该账户的用户的其他账户所涉及的一系列位置要素等。当然,账户地址冲突变量不限于上述三类变量,具体可以根据实际情况以及技术的发展进行扩展。在本实施例的一个可选实现方式中,如图8所示,所述第一确定模块702,包括:第一确定子模块801,被配置为利用评分卡模型中的变量处理方式确定所述账户地址冲突变量的WOE值以及IV值;筛选子模块802,被配置为根据所述IV值从所述账户地址冲突变量中筛选出至少一个特征显著变量;第二确定子模块803,被配置为根据所述特征显著变量的WOE值确定所述样本账户的所述样本学习评分值。该可选的实现方式中,IVInformationValue值通常称为信息值,可以用于表示账户地址冲突变量的重要性。IV值可以根据WOE分箱后每个分箱下账户地址冲突变量的WOE值来确定,具体可根据如下公式计算:其中,IVi为当前账户地址冲突变量在第i个WOE分箱的IV值,n为WOE分箱后的分箱个数,IV为当前账户地址冲突变量的IV值。由于IV值能够表征账户地址冲突变量的重要程度,因此可以根据账户地址冲突变量的IV值对账户地址冲突变量的重要性进行排序,并保留较为重要的一部分账户地址冲突变量来计算样本学习评分值和样本学习评分修正值,而剔除不重要的另一部分账户地址冲突变量,减少对评分结果的干扰。显著特征变量就是所有账户地址冲突变量中较为重要的一部分,可以通过预先设定的阈值确定,也即将IV值大于阈值的账户地址冲突变量选定为显著特征变量;该阈值可以根据经验等来设置,在此不做限制。在本实施例的一个可选实现方式中,如图9所示,所述修正模块703,包括:第三确定子模块901,被配置为确定所述特征显著变量的权重值;第四确定子模块902,被配置为利用所述权重值对所述特征显著变量的WOE值进行加权后确定所述样本学习评分修正值。该可选的实现方式中,可以根据专家经验和或以往的历史数据等确定账户地址冲突变量中特征显著变量的权重值,并根据权重值对特征显著变量的WOE值进行加权后确定样本学习评分修正值。在一实施例中,样本账户的样本学习评分修正值可以通过将多个显著特征变量的WOE值与对应的权重值相乘后相加得到样本学习评分修正值。在本实施例的一个可选实现方式中,如图10所示,所述第二确定模块704,包括:第五确定子模块1001,被配置为根据多个所述样本账户的所述已知结果、所述样本学习评分值和所述样本学习评分修正值确定多个候选取值区间对;其中,每个候选取值区间对包括第一候选取值区间和第二候选取值区间,且所述样本学习评分值在所述候选取值区间对中的所述第一候选取值区间中、所述样本学习评分修正值在所述候选取值区间对中的所述第二目标取值区间的所述样本账户中冒用账户的占比达到所述预设比例;第六确定子模块1002,被配置为从所述多个候选取值区间对中选择风险覆盖率最大的作为所述第一目标取值区间和第二目标取值区间。该可选的实现方式中,可以对样本学习评分值和样本学习评分修正值的最大取值范围进行区间划分,并找出区间内冒用账户比例达预设比例的候选取值区间对,例如,预设比例为99%,那么对于{样本学习分值大于等于10,样本学习修正分值大于等于190}的某个区间对A,样本学习分值大于等于10、且样本学习修正分值大于等于190的所有样本账户中99.5%的样本账户为冒用账户,那么可以将{样本学习分值大于等于10,样本学习修正分值大于等于190}区间对A设置为候选取值区间对。而对于{样本学习分值大于等于10,样本学习修正分值在130至190之间}的某个区间对B,样本学习分值大于等于10、且样本学习修正分值在130至190之间的所有样本账户中99%的样本账户为冒用账户,那么区间对B也可以设置为候选取值区间对。预设比例可以认为是冒用账户的识别准确率,也即本公开所选取的第一候选取值区间或第一目标取值区间和第二候选取值区间或第二目标取值区间至少能够识别出预设比例的冒用账户。在一实施例中,候选取值区间对可以通过最优WOE分箱的方式进行。WOE分箱有三种:等频、等宽和最优。最优的WOE分箱方式是通过对样本学习评分值和样本学习评分修正值的取值区间进行离散化,也即进行区间划分,并通过计算每个区间中的样本学习评分值和样本学习评分修正值的WOE值,进而计算出样本学习评分值和样本学习评分修正值的IV值,通过IV值选出一种最优的分箱方式,并最终选出候选取值区间对。WOE的分箱方式为现有技术,在此不再赘述。该可选的实现方式中不但考虑冒用账户识别准确率这一条件,还考虑了风险覆盖率这一条件,通过从多个候选取值区间中选择风险覆盖率最大的一对作为第一目标取值区间和第二目标取值时间,以便冒用账户的识别准确率达到预设比例的基础上,使得风险覆盖率最大化。风险覆盖率为样本学习评分值在第一目标取值区间、且样本学习评分修正值在第二目标取值区间中的冒用账户占所有样本账户中的所有冒用账户的比例。例如,对于上述候选区间对A,假如其风险覆盖率为7%,而候选区间对B,假如其风险覆盖率为17%,那么可以选择候选区间对B中的第一候选取值区间为第一目标取值区间,第二候选取值区间为第二目标取值区间。在本实施例的一个可选实现方式中,如图11所示,所述冒用账户识别装置还包括:第三确定模块1101,被配置为确定待识别账户的待识别评分值和待识别评分修正值;第四确定模块1102,被配置为根据所述待识别评分值、待识别评分修正值是否分别位于所述第一目标取值区间和第二目标取值区间中来确定所述待识别账户是否为冒用账户。该可选的实现方式中,在确定了第一目标取值区间和第二目标取值区间后,可以进行在线识别。在线识别过程中,对于待识别账户先确定其待识别学习评分值和待识别学习评分修正值,待识别账户的待识别评分值和待识别评分修正值的计算方式分别与样本账户的样本学习评分值和样本学习评分修正值相同;之后再根据待识别账户的待识别评分值和待识别评分修正值是否同时位于第一目标取值区间和第二目标取值区间来确定所述待识别账户是否为冒用账户,也即待识别账户是否被他人冒用,而不是与待识别账户的身份一致的用户使用。在本实施例的一个可选实现方式中,如图12所示,所述第三确定模块1101包括:第七确定子模块1201,被配置为确定所述待识别账户的账户地址冲突变量的WOE值;第八确定子模块1202,被配置为根据所述待识别账户的账户地址冲突变量的WOE值确定所述待识别评分值,进而根据所述待识别账户的账户地址冲突变量的WOE值以及所述待识别账户的账户地址冲突变量的重要性确定所述待识别评分修正值。该可选的实现方式中,待识别账户的账户地址冲突变量的WOE值为该账户地址冲突变量的值所落入的WOE分箱的WOEi值,WOEi的值可以为图1所示实施例中根据样本账户的账户地址冲突变量确定的值。待识别账户的待识别评分值为待识别账户的所有账户地址冲突变量或者显著特征变量的WOE值累加得到,待识别评分修正值可以通过待识别账户的所有账户地址冲突变量或者显著特征变量的WOE值加权后累加得到,此处的加权是利用账户地址冲突变量或者显著特征变量的重要性进行加权。图13是适于用来实现根据本公开实施方式的冒用账户识别方法的电子设备的结构示意图。如图13所示,电子设备1300包括中央处理单元CPU1301,其可以根据存储在只读存储器ROM1302中的程序或者从存储部分1308加载到随机访问存储器RAM1303中的程序而执行上述图1所示的实施方式中的各种处理。在RAM1303中,还存储有电子设备1300操作所需的各种程序和数据。CPU1301、ROM1302以及RAM1303通过总线1304彼此相连。输入输出IO接口1305也连接至总线1304。以下部件连接至IO接口1305:包括键盘、鼠标等的输入部分1306;包括诸如阴极射线管CRT、液晶显示器LCD等以及扬声器等的输出部分1307;包括硬盘等的存储部分1308;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1309。通信部分1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至IO接口1305。可拆卸介质1311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1310上,以便于从其上读出的计算机程序根据需要被安装入存储部分1308。特别地,根据本公开的实施方式,上文参考图1描述的方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行图1所示方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分1309从网络上被下载和安装,和或从可拆卸介质1311被安装。附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和或流程图中的每个方框、以及框图和或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的但不限于具有类似功能的技术特征进行互相替换而形成的技术方案。

权利要求:1.一种冒用账户识别方法,其特征在于,包括:获取多个样本账户的账户地址冲突变量;根据评分卡模型中的变量处理方式得到所述账户地址冲突变量的WOE值,并根据所述WOE值确定所述样本账户的样本学习评分值;根据所述账户地址冲突变量的重要程度以及所述WOE值对所述样本学习评分值进行修正,以获得样本学习评分修正值;根据所述样本账户是否被冒用的已知结果、所述样本学习评分值和所述样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得所述第一目标取值区间和第二目标取值区间所覆盖的所述样本账户中冒用账户的比例能够达到预设比例。2.根据权利要求1所述的方法,其特征在于,所述账户地址冲突变量包括以下至少之一:标识所述样本账户的同账户身份相关的位置要素与同账户操作者相关的位置要素之间冲突的第一类变量;标识所述样本账户的同账户操作者相关的位置要素与同账户操作者相关的位置要素之间冲突的第二类变量;标识所述样本账户的同账户操作者相关的位置要素与同身份不同账户身份相关的位置要素之间冲突的第三类变量。3.根据权利要求1或2所述的方法,其特征在于,根据评分卡模型中的变量处理方式得到所述账户地址冲突变量的WOE值,并根据所述WOE值确定所述样本账户的样本学习评分值,包括:利用评分卡模型中的变量处理方式确定所述账户地址冲突变量的WOE值以及IV值;根据所述IV值从所述账户地址冲突变量中筛选出至少一个特征显著变量;根据所述特征显著变量的WOE值确定所述样本账户的所述样本学习评分值。4.根据权利要求3所述的方法,其特征在于,根据所述账户地址冲突变量的重要程度以及所述WOE值对所述样本学习评分值进行修正,以获得样本学习评分修正值,包括:确定所述特征显著变量的权重值;利用所述权重值对所述特征显著变量的WOE值进行加权后确定所述样本学习评分修正值。5.根据权利要求1-2、4任一项所述的方法,其特征在于,根据所述样本账户是否被冒用的已知结果、所述样本学习评分值和所述样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得所述第一目标取值区间和第二目标取值区间所覆盖的所述样本账户中冒用账户的比例能够达到预设比例,包括:根据多个所述样本账户的所述已知结果、所述样本学习评分值和所述样本学习评分修正值确定多个候选取值区间对;其中,每个候选取值区间对包括第一候选取值区间和第二候选取值区间,且所述样本学习评分值在所述候选取值区间对中的所述第一候选取值区间中、所述样本学习评分修正值在所述候选取值区间对中的所述第二目标取值区间的所述样本账户中冒用账户的占比达到所述预设比例;从所述多个候选取值区间对中选择风险覆盖率最大的作为所述第一目标取值区间和第二目标取值区间。6.根据权利要求1所述的方法,其特征在于,还包括:确定待识别账户的待识别评分值和待识别评分修正值;根据所述待识别评分值、待识别评分修正值是否分别位于所述第一目标取值区间和第二目标取值区间中来确定所述待识别账户是否为冒用账户。7.根据权利要求6所述的方法,其特征在于,确定待识别账户的待识别学习评分值和待识别学习评分修正值,包括:确定所述待识别账户的账户地址冲突变量的WOE值;根据所述待识别账户的账户地址冲突变量的WOE值确定所述待识别评分值,进而根据所述待识别账户的账户地址冲突变量的WOE值以及所述待识别账户的账户地址冲突变量的重要性确定所述待识别评分修正值。8.一种冒用账户识别装置,其特征在于,包括:获取模块,被配置为获取多个样本账户的账户地址冲突变量;第一确定模块,被配置为根据评分卡模型中的变量处理方式得到所述账户地址冲突变量的WOE值,并根据所述WOE值确定所述样本账户的样本学习评分值;修正模块,被配置为根据所述账户地址冲突变量的重要程度以及所述WOE值对所述样本学习评分值进行修正,以获得样本学习评分修正值;第二确定模块,被配置为根据所述样本账户是否被冒用的已知结果、所述样本学习评分值和所述样本学习评分修正值确定第一目标取值区间和第二目标取值区间,使得所述第一目标取值区间和第二目标取值区间所覆盖的所述样本账户中冒用账户的比例能够达到预设比例。9.根据权利要求8所述的装置,其特征在于,所述账户地址冲突变量包括以下至少之一:标识所述样本账户的同账户身份相关的位置要素与同账户操作者相关的位置要素之间冲突的第一类变量;标识所述样本账户的同账户操作者相关的位置要素与同账户操作者相关的位置要素之间冲突的第二类变量;标识所述样本账户的同账户操作者相关的位置要素与同身份不同账户身份相关的位置要素之间冲突的第三类变量。10.根据权利要求8或9所述的装置,其特征在于,所述第一确定模块,包括:第一确定子模块,被配置为利用评分卡模型中的变量处理方式确定所述账户地址冲突变量的WOE值以及IV值;筛选子模块,被配置为根据所述IV值从所述账户地址冲突变量中筛选出至少一个特征显著变量;第二确定子模块,被配置为根据所述特征显著变量的WOE值确定所述样本账户的所述样本学习评分值。11.根据权利要求10所述的装置,其特征在于,所述修正模块,包括:第三确定子模块,被配置为确定所述特征显著变量的权重值;第四确定子模块,被配置为利用所述权重值对所述特征显著变量的WOE值进行加权后确定所述样本学习评分修正值。12.根据权利要求8-9、11任一项所述的装置,其特征在于,第二确定模块,包括:第五确定子模块,被配置为根据多个所述样本账户的所述已知结果、所述样本学习评分值和所述样本学习评分修正值确定多个候选取值区间对;其中,每个候选取值区间对包括第一候选取值区间和第二候选取值区间,且所述样本学习评分值在所述候选取值区间对中的所述第一候选取值区间中、所述样本学习评分修正值在所述候选取值区间对中的所述第二目标取值区间的所述样本账户中冒用账户的占比达到所述预设比例;第六确定子模块,被配置为从所述多个候选取值区间对中选择风险覆盖率最大的作为所述第一目标取值区间和第二目标取值区间。13.根据权利要求8所述的装置,其特征在于,还包括:第三确定模块,被配置为确定待识别账户的待识别评分值和待识别评分修正值;第四确定模块,被配置为根据所述待识别评分值、待识别评分修正值是否分别位于所述第一目标取值区间和第二目标取值区间中来确定所述待识别账户是否为冒用账户。14.根据权利要求13所述的装置,其特征在于,所述第三确定模块,包括:第七确定子模块,被配置为确定所述待识别账户的账户地址冲突变量的WOE值;第八确定子模块,被配置为根据所述待识别账户的账户地址冲突变量的WOE值确定所述待识别评分值,进而根据所述待识别账户的账户地址冲突变量的WOE值以及所述待识别账户的账户地址冲突变量的重要性确定所述待识别评分修正值。15.一种电子设备,其特征在于,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现权利要求1-7任一项所述的方法步骤。16.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-7任一项所述的方法步骤。

百度查询: 创新先进技术有限公司 冒用账户识别方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。