买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于Pregel的实现挖掘商业银行交易数据的资金圈分布的方法_北京海致星图科技有限公司_202011267511.1 

申请/专利权人:北京海致星图科技有限公司

申请日:2020-11-13

公开(公告)日:2024-04-12

公开(公告)号:CN112256769B

主分类号:G06F16/2458

分类号:G06F16/2458;G06Q40/02;G06Q40/04

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2021.02.09#实质审查的生效;2021.01.22#公开

摘要:本发明公开了一种基于Pregel的实现挖掘商业银行交易数据的资金圈分布的方法,包括如下步骤:步骤1:以转账交易数据构建边,形成一个资金交易的有向图;步骤2:设计一种对适配性强的迭代算法,并基于spark的pregel引擎实现,以此找出成环的资金流向。本发明解决了在利用传统方法求解资金圈形态时,由于潜在的数据倾斜导致性能不佳的问题。本发明方法依旧采用逐层迭代,但不再需要多次大表join,解决了传统做法由于多次join,代码冗余,且不能灵活跟随资金圈的节点个数的问题。本发明在代码完成后,能够支持不改变原有任何代码逻辑,将代码打包,并且只需要在配置文件中配置层次参数,就能动态实现寻找k个节点的资金圈,这更适合真实业务场景,提升效率。

主权项:1.一种基于Pregel的实现挖掘商业银行交易数据的资金圈分布的方法,其特征在于:包括如下步骤:步骤1:以转账交易数据构建边,形成一个有向图,图中每一条边都是一个转账交易行为,边的表达形式如下:a,b,attrs,整个有向图的数学形式为:[srcId,srcAttr,dstId,dstAttr,attr];其中a,b代表企业实体,attrs代表a和b转账行为的自有属性;其中,srcId为a转账方节点id;其中,srcAttr为a转账方节点自身属性;其中,dstId为b转账方节点id;其中,dstAttr为b转账方节点自身属性;其中,attr为转账属性;步骤2:利用Spark大数据的pregel,设计迭代算法,基于pregel实现,找出成环的资金流向;其中,所述步骤2中的迭代算法设计依据为根据业务需求而定,且业务需求限定为:Attrx=FAttrx-1,其中,Attr代表某笔交易的转账属性,Attrx-1代表x-1刻的交易,Attrx代表第x刻的交易,F代表约束关系,或称为迭代条件,任何两笔相邻的转账都符合该种约束关系;当F与转账金额,转账时间有关时,抽象表达如下:F~factor1,factor2,..;其中,Factor,factor2表示迭代条件的要素,也是一笔转账里包含的属性,在图中为边属性;假设限定迭代条件F~factor1,factor2,...,迭代算法步骤如下:S1:对有向图中所有节点设定初始属性attr,且attr包含srcId,作为自身节点的初始化属性id,以及自定义属性,用自己的节点id作为所属强连通分支的id,并将所有节点打上初始标记false;S2:首先做循环,将只有出边或入边的节点标记为true,将“只存在单向边的或者孤立的节点”和“已经确认且打好标记的强连通分量”中的被标记为true的节点从有向图中去除;S3:初始化完成自身的属性后,基于Pregel计算框架,开始分布式进行有向图的信息传递,图中每一条边沿着出边由src节点向dst节点发送自己的属性id,并且设置如下规则,只允许属性id小的节点向属性id大的节点传递信息,或者属性值大的往属性小的传递,取决于实现方法,该种操作会决定哪个节点会作为强连通分量的唯一性标记;其中,在由src节点向dst节点传递的过程中,为了实现两笔转账的约束条件F,需要做如下操作:在A传递到B的时候,需要连带边属性attr传入给B,作为B的节点属性,也即自定义属性,之后B传递给C时,B的节点属性需要与B-C转账的边属性进行比较,且需要满足F条件,否则B-C不往下传递,抽象表示如下:FattrAB,attrBC=FsrcAttr_B,attrBC=true;S4:当深搜结束,Pregel中是人为设置遍历深度,默认为原图已被“着色”,有向图开始反向遍历,为着色完成的图中节点反向打标签以确定是否完成强连通分支id标记,在着色完成的图中,节点id与节点属性id相同时,则表明该节点是自身所处强连通分支的root节点,则节点标签标记为true,之后,有向图中所有节点沿着入边由dst节点向src节点发送自身标记情况,只要节点收到true消息,则该节点便标记为true;S5:反向遍历同样深度后,遍历到的节点完成了强连通分量的标记,然后将该部分节点从原图中删除,作为返回结果的一部分,剩下的节点构成新的原图,重新执行步骤S1-S4,直到整张图所有节点被删除干净;其中,在由dst节点向src节点传递的过程中,需要满足:F逆attrBC,attrAB=F逆srcAttr_C,attrBC=true;其中,F逆表示F的逆转条件,即从dst出发去看待F条件。

全文数据:

权利要求:

百度查询: 北京海致星图科技有限公司 一种基于Pregel的实现挖掘商业银行交易数据的资金圈分布的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。