买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于线上交易特征的反欺诈模块决策融合方法_同济大学_201910180559.X 

申请/专利权人:同济大学

申请日:2019-03-11

公开(公告)日:2021-02-23

公开(公告)号:CN110020868B

主分类号:G06Q20/40(20120101)

分类号:G06Q20/40(20120101);G06K9/62(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.02.23#授权;2019.08.09#实质审查的生效;2019.07.16#公开

摘要:本发明提供一种基于线上交易特征的反欺诈模块决策融合方法,包括步骤:S1:根据具体场景设置若干反欺诈模块和特征数据;S2:根据特征数据将训练数据集划分为多个数据子集;S3:利用多个数据子集对各反欺诈模块进行训练;S4:分别计算各反欺诈模块的性能指标,根据性能指标调整各反欺诈模块的参数来提高各反欺诈模块的性能;S5:排列获得各反欺诈模块的全部逻辑组合方式,对各逻辑组合方式进行集成训练,获得集成模型;S6:利用集成模型判断当前交易是否为欺诈交易。本发明的一种基于线上交易特征的反欺诈模块决策融合方法,能够根据交易数据的特征自适应的产生对应的决策方案,并根据决策方案获得交易是否为欺诈的判断结果。

主权项:1.一种基于线上交易特征的反欺诈模块决策融合方法,包括步骤:S1:根据具体场景设置若干反欺诈模块和每一所述反欺诈模块所需的特征数据,每一所述反欺诈模块包括不同的一反欺诈算法;S2:根据所述特征数据分割一训练数据集,将所述训练数据集划分为多个数据子集;S3:将多个所述数据子集分别输入各所述反欺诈模块的反欺诈算法,对各所述反欺诈模块进行训练;获得各所述反欺诈模块的第一输出结果;S4:根据所述第一输出结果,分别计算各所述反欺诈模块的性能指标,根据所述性能指标调整各所述反欺诈模块的参数来提高各所述反欺诈模块的性能;S5:排列获得各所述反欺诈模块的全部逻辑组合方式,对各所述逻辑组合方式的所述反欺诈模块进行集成训练,获得一集成模型;S6:利用所述集成模型判断当前交易是否为欺诈交易;所述S4步骤进一步包括步骤:S41:根据所述第一输出结果,分别计算各所述反欺诈模块的性能指标;所述性能指标包括召回率、精确率和打扰率;S42:调整各所述反欺诈模块的参数,在保证各所述反欺诈模块的所述召回率大于一预设阈值的情况下,最小化所述打扰率并最大化所述精确率;S43:保存所述第一输出结果,并将所述第一输出结果作为一训练集;所述S5步骤进一步包括步骤:S51:排列获得各所述反欺诈模块的全部逻辑组合方式;S52:利用所述训练集对各所述反欺诈模块进行训练,获得一第二输出结果;S53:根据所述第二输出结果计算获得各所述逻辑组合方式的第一预测结果;S54:将各所述逻辑组合方式的所述第一预测结果分别与各欺诈场景的真实结果作比较;S55:将所述第一预测结果与所述真实结果一致的所述逻辑组合方式作为该真实结果所对应的所述欺诈场景的所述集成模型。

全文数据:基于线上交易特征的反欺诈模块决策融合方法技术领域本发明涉及互联网金融交易反欺诈技术领域,尤其涉及一种基于线上交易特征的反欺诈模块决策融合方法。背景技术随着社会经济和互联网技术的发展,金融领域逐渐将业务拓展至互联网金融方面。互联网金融由于其便捷性迅速得到大众的认可,但是由于互联网环境的复杂性,对于通过互联网交易的双方无法准确评估交易产生的欺诈风险,经常出现因身份盗用、设备丢失等情况导致的欺诈问题,因此针对互联网金融反欺诈工作尤为重要。现阶段海量的互联网金融交易数据,使得基于机器学习的反欺诈方法成为目前主流研究方向。利用海量数据,从数据中提取有效特征,利用已标明标签的交易数据训练分类模型,利用训练好的分类模型可以有效的辨别交易是否为欺诈交易,同时对欺诈交易进行拦截。此类方法中,使用单一的机器学习检测模块,往往会存在对不同类型欺诈交易特征不敏感的问题,导致误报率和漏报率的提高。为缓解这个问题,通常会采用多模块集成的方式建立反欺诈检测系统。多模块集成方法利用互补性,弥补单一模块的不足之处,综合检测欺诈特征。同时,这种模块化的设计本身也提高了反欺诈系统的开发和维护效率。现有的多模块融合策略主要有以下几种:1投票法:该类方法采用投票的方式,以少数服从多数的原则决定最终系统输出。各个模块给出判断,判断此时的交易是否为欺诈交易,系统根据各个模块输出的结果,取其中最多的情况为系统预测的最终结果。2赋予权重法:为每个模块赋予一定权重,系统根据权重决定最终输出结果。由于实际应用场景中,不同类型欺诈发生的频率不同,因此不能对各个模块赋予相同权重值。通过统计不同欺诈类型的占比,确定各个模块的权重值。或者设立预测函数bx为:其中wi为需要训练的权重,gix表示所采用的假设模型;x表示特征子集;χ表示特征集合;目标函数为minsqrbx-y的方式确定各个模块的权重;其中,y表示对应特征的标识。以上的多模块组合策略应用便捷,但是存在以下问题:1系统决策方式单一,仅通过多个模块得出的预测结果按照投票法等方式决定最终结果,决策方式过于简单。2决策方案过于依赖模块之间的独立性,若模块之间独立性良好,则整个系统决策的准确率越高,相反则会影响系统的性能。3自适应能力差,仅能利用已训练好的方式判断是否为欺诈交易,无法根据不同交易数据的特征自适应的产生不同决策方案。4对不同类型欺诈交易不敏感,当欺诈场景出现新的欺诈类型时,反欺诈系统依然根据之前的决策方式加以判断,无法及时调整决策方案,对新的欺诈类型加以拦截。综上所述,现有技术存在的问题:系统决策方式单一,仅利用简单的组合策略进行集成,过分依赖模块之间的独立性,对不同类型欺诈交易不敏感,自适应能力差,无法根据交易数据特征选用不同的决策方法。发明内容针对上述现有技术中的不足,本发明提供一种基于线上交易特征的反欺诈模块决策融合方法,能够根据交易数据的特征自适应的产生对应的决策方案,并根据决策方案获得交易是否为欺诈的判断结果。为了实现上述目的,本发明提供一种基于线上交易特征的反欺诈模块决策融合方法,包括步骤:S1:根据具体场景设置若干反欺诈模块和每一所述反欺诈模块所需的特征数据,每一所述反欺诈模块包括不同的一反欺诈算法;S2:根据所述特征数据分割一训练数据集,将所述训练数据集划分为多个数据子集;S3:将多个所述数据子集分别输入各所述反欺诈模块的反欺诈算法,对各所述反欺诈模块进行训练;获得各所述反欺诈模块的第一输出结果;S4:根据所述第一输出结果,分别计算各所述反欺诈模块的性能指标,根据所述性能指标调整各所述反欺诈模块的参数来提高各所述反欺诈模块的性能;S5:排列获得各所述反欺诈模块的全部逻辑组合方式,对各所述逻辑组合方式的所述反欺诈模块进行集成训练,获得一集成模型;S6:利用所述集成模型判断当前交易是否为欺诈交易。优选地,所述S1步骤中:每一所述反欺诈模块对应一类欺诈场景;不同所述反欺诈模块的所述特征数据的种类至少有一个不同。优选地,各所述特征数据分别为一特征集的子集,所述特征集包括一互联网金融交易数据的所有特征。优选地,所述性能指标包括召回率、精确率和打扰率。优选地,所述S4步骤进一步包括步骤:S41:根据所述第一输出结果,分别计算各所述反欺诈模块的性能指标;S42:调整各所述反欺诈模块的参数,在保证各所述反欺诈模块的所述召回率大于一预设阈值的情况下,最小化所述打扰率并最大化所述精确率;S43:保存所述第一输出结果,并将所述第一输出结果作为一训练集。优选地,所述S5步骤进一步包括步骤:S51:排列获得各所述反欺诈模块的全部逻辑组合方式;S52:利用所述训练集对各所述反欺诈模块进行训练,获得一第二输出结果;S53:根据所述第二输出结果计算获得各所述逻辑组合方式的第一预测结果;S54:将各所述逻辑组合方式的所述第一预测结果分别与各所述欺诈场景的真实结果作比较;S55:将所述第一预测结果与所述真实结果一致的所述逻辑组合方式作为该真实结果所对应的所述欺诈场景的所述集成模型。优选地,所述S6步骤进一步包括步骤:S61:输入所述当前交易的一互联网金融交易数据;S62:将所述互联网金融交易数据归类到一所述欺诈场景;S63:根据归类到的所述欺诈场景选择对应所述集成模型;S64:将所述互联网金融交易数据输入被选择的所述集成模型,获得至少一第二预测结果;S65:根据所述第二预测结果判断所述当前交易是否为欺诈交易。优选地,所述S6步骤后还包括步骤:当所述当前交易判断为欺诈交易时,发出警报并对所述当前交易进行拦截。本发明由于采用了以上技术方案,使其具有以下有益效果:本方法利用逻辑组合的方式对各个反欺诈模块进行集成,解决单个反欺诈模块的单一性问题,实现各个反欺诈模块之间的互补,同时能够使用逻辑组合策略对预测结果给出解释,具有一定的可解释性;另外,通过训练分类的决策方式,使用交易数据特征了选择最适用的逻辑组合方案加以判断,屏蔽了无关反欺诈模块可能带来的消极影响,而非使用所有反欺诈模块对交易数据进行判断。可根据每笔交易的数据特征使用不同的逻辑组合方式做出判断,具有良好的自适应性,避免了决策方案单一导致的低效问题。另外,可有效地检测出线上欺诈交易,具有良好的可扩展性,当添加新的反欺诈模块或删除部分反欺诈模块时,仅需重新训练一次模块集成过程,便能够正常使用,具备较强的灵活性;集成策略灵活,反欺诈模块可升级。附图说明图1为本发明实施例的基于线上交易特征的反欺诈模块决策融合方法的流程图;图2为本发明实施例的基于线上交易特征的反欺诈模块决策融合方法的原理图。具体实施方式下面根据附图1和图2,给出本发明的较佳实施例,并予以详细描述,使能更好地理解本发明的功能、特点。请参阅图1和图2,本发明实施例的一种基于线上交易特征的反欺诈模块决策融合方法,包括步骤:S1:根据具体场景设置若干反欺诈模块和每一反欺诈模块所需的特征数据,每一反欺诈模块包括不同的一反欺诈算法。其中,每一反欺诈模块对应一类欺诈场景;不同反欺诈模块的特征数据的种类至少有一个不同。各特征数据分别为一特征集的子集,特征集包括一互联网金融交易数据的所有特征。应确保各反欺诈模块所选特征集的子集交集较少,尽可能相互独立,进而在后续反欺诈模块组合后表现出多样性的特征。S2:根据特征数据分割一训练数据集,将训练数据集划分为多个数据子集,用于训练每个反欺诈模块。S3:将多个数据子集分别输入各反欺诈模块的反欺诈算法,对各反欺诈模块进行训练;获得各反欺诈模块的第一输出结果。本步骤中,实现各个模块中的反欺诈算法,各个反欺诈模块使用的反欺诈算法可以为机器学习领域中的随机森林、神经网络等常用机器学习算法,也可以是通过集成学习组合成的模型;S4:根据第一输出结果,分别计算各反欺诈模块的性能指标,根据性能指标调整各反欺诈模块的参数来提高各反欺诈模块的性能;使得反欺诈模块组合后能表现更高的性能。其中,性能指标包括召回率、精确率和打扰率。S4步骤进一步包括步骤:S41:根据第一输出结果,分别计算各反欺诈模块的性能指标;S42:调整各反欺诈模块的参数,在保证各反欺诈模块的召回率大于一预设阈值的情况下,最小化打扰率并最大化精确率;S43:保存第一输出结果,并将第一输出结果作为一训练集。S5:排列获得各反欺诈模块的全部逻辑组合方式,对各逻辑组合方式的反欺诈模块进行集成训练,获得一集成模型。本实施例中,S5步骤进一步包括步骤:S51:排列获得各反欺诈模块的全部逻辑组合方式,并对各逻辑组合方式进行编号;S52:利用训练集对各反欺诈模块进行训练,获得一第二输出结果;S53:根据第二输出结果计算获得各逻辑组合方式的第一预测结果;S54:将各逻辑组合方式的第一预测结果分别与各欺诈场景的真实结果作比较;S55:将第一预测结果与真实结果一致的逻辑组合方式作为该真实结果所对应的欺诈场景的集成模型,同时可将真实结果对应的样本数据拆成多份,每一集成模型存储一份拆分后的样本数据。例如:当存在三种反欺诈模块a、b、c时,总共具有18种逻辑组合方式,所有逻辑组合方式罗列如下:。1、a2、b3、c4、a|b5、a|c6、b|c7、a&b8、a&c9、b&c10、a|b|c11、a&b&c12、a|b&c13、b|a&c14、c|a&b15、a&b|c16、b&a|c17、c&a|b18、a|b&a|c&b|c计算得出所有反欺诈模块的逻辑组合方式后,利用XGboost和Stacking原理和方法,将各个反欺诈模块预测输出值作为集成模型的输入值,将真实结果作集成模型的真值,对反欺诈模块进行集成。S6:利用集成模型判断当前交易是否为欺诈交易。本实施例中,S6步骤进一步包括步骤:S61:输入当前交易的一互联网金融交易数据;S62:将互联网金融交易数据归类到一欺诈场景;S63:根据归类到的欺诈场景选择对应集成模型;S64:将互联网金融交易数据输入被选择的集成模型,获得至少一第二预测结果;S65:根据第二预测结果判断当前交易是否为欺诈交易。反欺诈系统会根据每笔交易数据的特征给出该笔交易是否为欺诈交易,从而得到最终测试数据集的结果。当模块集成模型训练完成后,每一笔新输入的线上交易数据根据该笔交易的特征通过分类的方式,将其分发到能够相对正确判断的逻辑组合中判断该笔交易是否为欺诈交易,判断过程中可能使用所有模块中的一种或部分反欺诈模块,也有可能使用所有反欺诈模块,使用的反欺诈模块数量根据交易的数据特征决定。通过逻辑组合的方式判断交易是否为欺诈交易,具有很好的可解释性、扩展性和自适应性,并且能够进一步优化系统性能,当一段时间后得知部分交易判断错误,可以利用新的数据集重新训练集成过程,进一步提高反欺诈系统的性能。同时通过逻辑组合的方式集成多个反欺诈模块,能够覆盖互联网金融交易的大部分欺诈场景,对新出现的欺诈场景,仅需添加解决该类场景的模块,然后重新训练集成过程。本实施例中,S6步骤后还包括步骤:当当前交易判断为欺诈交易时,发出警报并对当前交易进行拦截;否则允许当前交易按照正常流程执行。本发明实施例的一种基于线上交易特征的反欺诈模块决策融合方法,能够根据交易数据的特征自适应的产生对应的决策方案。本方法将各个反欺诈模块都设定为“识伪模型”,即对于输出结果而言,输出为欺诈交易的结果相对于输出为非欺诈交易的结果来讲置信度更高。因而本方法提出的逻辑组合方法中不包括非的情况。当反欺诈系统中存在两种反欺诈模块a和b时,则总共存在四种逻辑组合方式为:a、b、a&b、a|b,针对不同的交易数据特征,利用不同的逻辑组合方式判断是否为欺诈交易,具有良好的自适应和可解释性的优点。因此,当反欺诈系统中存在M个模块时,总共具有个逻辑组合方式,其中,其中,表示组合数,即从M种个体中选取其中k种的不同取法的种数。系统可根据具体场景具体需求增加或减少反欺诈模块数量,使得系统判断欺诈交易方式更加灵活和准确。同时,利用每个反欺诈模块输出的值作为包括集成模型的反欺诈系统的输入值,对应的实际结果作为反欺诈系统的结果进行训练,最终能够训练得出一条交易记录,系统能够根据该笔交易特征用对应有效的逻辑组合方式进行预测得出该交易是否为欺诈交易。本发明实施例的一种基于线上交易特征的反欺诈模块决策融合方法,具有如下有益效果:第一,有效地检测出线上欺诈交易,具有良好的可扩展性,当添加新的反欺诈模块或删除部分反欺诈模块时,仅需重新训练一次模块集成过程,便能够正常使用,具备较强的灵活性;集成策略灵活,反欺诈模块可升级;第二,利用逻辑组合的方式对各个反欺诈模块进行集成,解决单个反欺诈模块的单一性问题,实现各个反欺诈模块之间的互补,同时能够使用逻辑组合策略对预测结果给出解释,具有一定的可解释性;另外,通过训练分类的决策方式,使用交易数据特征了选择最适用的逻辑组合方案加以判断,屏蔽了无关反欺诈模块可能带来的消极影响,而非使用所有反欺诈模块对交易数据进行判断。第三,可根据每笔交易的数据特征使用不同的逻辑组合方式做出判断,具有良好的自适应性,避免了决策方案单一导致的低效问题。各种类型的特征具有自身的优势,特征类型之间的互补,可以更好的做到反欺诈模块之间的独立性和多样性,丰富本方法的应用场景。针对不同的应用场景,选择对应的特征类型和反欺诈模块,融合各种学习算法的优势,克服各个算法之间的不足之处,从而提高反欺诈系统的性能。以上结合附图实施例对本发明进行了详细说明,本领域中普通技术人员可根据上述说明对本发明做出种种变化例。因而,实施例中的某些细节不应构成对本发明的限定,本发明将以所附权利要求书界定的范围作为本发明的保护范围。

权利要求:1.一种基于线上交易特征的反欺诈模块决策融合方法,包括步骤:S1:根据具体场景设置若干反欺诈模块和每一所述反欺诈模块所需的特征数据,每一所述反欺诈模块包括不同的一反欺诈算法;S2:根据所述特征数据分割一训练数据集,将所述训练数据集划分为多个数据子集;S3:将多个所述数据子集分别输入各所述反欺诈模块的反欺诈算法,对各所述反欺诈模块进行训练;获得各所述反欺诈模块的第一输出结果;S4:根据所述第一输出结果,分别计算各所述反欺诈模块的性能指标,根据所述性能指标调整各所述反欺诈模块的参数来提高各所述反欺诈模块的性能;S5:排列获得各所述反欺诈模块的全部逻辑组合方式,对各所述逻辑组合方式的所述反欺诈模块进行集成训练,获得一集成模型;S6:利用所述集成模型判断当前交易是否为欺诈交易。2.根据权利要求1所述的基于线上交易特征的反欺诈模块决策融合方法,其特征在于,所述S1步骤中:每一所述反欺诈模块对应一类欺诈场景;不同所述反欺诈模块的所述特征数据的种类至少有一个不同。3.根据权利要求2所述的基于线上交易特征的反欺诈模块决策融合方法,其特征在于,各所述特征数据分别为一特征集的子集,所述特征集包括一互联网金融交易数据的所有特征。4.根据权利要求3所述的基于线上交易特征的反欺诈模块决策融合方法,其特征在于,所述性能指标包括召回率、精确率和打扰率。5.根据权利要求4所述的基于线上交易特征的反欺诈模块决策融合方法,其特征在于,所述S4步骤进一步包括步骤:S41:根据所述第一输出结果,分别计算各所述反欺诈模块的性能指标;S42:调整各所述反欺诈模块的参数,在保证各所述反欺诈模块的所述召回率大于一预设阈值的情况下,最小化所述打扰率并最大化所述精确率;S43:保存所述第一输出结果,并将所述第一输出结果作为一训练集。6.根据权利要求5所述的基于线上交易特征的反欺诈模块决策融合方法,其特征在于,所述S5步骤进一步包括步骤:S51:排列获得各所述反欺诈模块的全部逻辑组合方式;S52:利用所述训练集对各所述反欺诈模块进行训练,获得一第二输出结果;S53:根据所述第二输出结果计算获得各所述逻辑组合方式的第一预测结果;S54:将各所述逻辑组合方式的所述第一预测结果分别与各所述欺诈场景的真实结果作比较;S55:将所述第一预测结果与所述真实结果一致的所述逻辑组合方式作为该真实结果所对应的所述欺诈场景的所述集成模型。7.根据权利要求5所述的基于线上交易特征的反欺诈模块决策融合方法,其特征在于,所述S6步骤进一步包括步骤:S61:输入所述当前交易的一互联网金融交易数据;S62:将所述互联网金融交易数据归类到一所述欺诈场景;S63:根据归类到的所述欺诈场景选择对应所述集成模型;S64:将所述互联网金融交易数据输入被选择的所述集成模型,获得至少一第二预测结果;S65:根据所述第二预测结果判断所述当前交易是否为欺诈交易。8.根据权利要求7所述的基于线上交易特征的反欺诈模块决策融合方法,其特征在于,所述S6步骤后还包括步骤:当所述当前交易判断为欺诈交易时,发出警报并对所述当前交易进行拦截。

百度查询: 同济大学 基于线上交易特征的反欺诈模块决策融合方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。