买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种考虑竞争模式的关联挖掘算法_北京比财数据科技有限公司_201911024203.3 

申请/专利权人:北京比财数据科技有限公司

申请日:2019-10-25

公开(公告)日:2020-03-24

公开(公告)号:CN110909238A

主分类号:G06F16/9535(20190101)

分类号:G06F16/9535(20190101);G06F16/2455(20190101);G06Q40/06(20120101);G06Q40/04(20120101);G06K9/62(20060101)

优先权:

专利状态码:有效-授权

法律状态:2022.06.07#授权;2020.04.17#实质审查的生效;2020.03.24#公开

摘要:一种考虑竞争模式的关联挖掘算法是用于理财产品组合的推荐算法。通过用户历史行为可以得到理财产品组合数据,再通过产品组合的历史数据得到均衡的协作记录和竞争记录,并给予一种决策树算法RuleTree从中挖掘出相应的协作关联规则和竞争关联规则。最后提出了规则评价模型RuleScore,对关联规则的信息价值进行评价,并将所得规则用于理财产品组合的预测和推荐。

主权项:1.一种考虑竞争模式的关联挖掘算法,其特征在于:每笔理财产品交易记录的形式为二元组:ID,ProdList;其中ID为交易的序列号,ProdList是在一笔交易中数目不等的理财产品列表;一生成频繁项集:1初始化计算支持度:扫描全部交易,设最小支持度为MinSupt;遍历所有理财产品,生成每个产品的1项集;每个产品的1项集的支持度为其中N为全部交易的笔数,np为理财产品p出现在交易记录中的交易记录数量;筛选支持度不小于最小支持度MinSupt的理财产品列表,得到频繁1项集列表;2自连接与剪枝:将上一步得到的频繁1项集列表中的项集进行自连接,生成2项集;随后进行剪枝处理,即对于生成的2项集,将子集含有非频繁项集的2项集剔除,生成2项集列表;3计算支持度:对于第二步生成的2项集列表,计算每个项集的支持度其中表示含有2项理财产品的2项集p2在全部交易中出现的交易次数,筛选支持度不小于最小支持度的理财产品列表,得到频繁2项集列表;4按照2,3步的方式,将2项集自连接并剪枝,筛选后得到频繁3项集列表;循环得到包含更多产品的项集列表;直到没有符合条件的项集列表,循环停止;二生成关联规则设第一步生成的频繁项集中的某项集{pi,pj}的支持度为supt{pi,pj},则置信度筛选置信度不小于最小置信度的理财产品列表,得到关联规则;a生成关联规则A.生成频繁2项集1计算支持度:遍历全部理财产品交易记录,遍历所有理财产品,生成每个产品的1项集;1项集每个产品的支持度为其中N为全部交易的笔数,np为理财产品p出现的交易笔数;筛选支持度不小于最小支持度MinSupt1的理财产品,得到频繁1项集列表;MinSup1取各产品支持度的平均数或中位数,若为小数则向下取整,即只选取整数位;2自连接:将上一步得到的频繁1项集列表进行自连接,生成2项集,形式为{pi,pj};计算2项集各产品对的支持度其中N为全部交易的笔数,为理财产品对{pi,pj}出现的交易笔数;筛选支持度不小于最小支持度MinSupt2的理财产品对,得到频繁2项集列表;MinSupt2取各产品对支持度的平均数或中位数,若为小数则向下取整,即只选取整数位;B.生成关联规则将频繁2项集中的每一个产品对作为一条关联规则,格式如pi,pj,1,此处有标志位1表示此规则为关联规则;计算每条规则的置信度设最小置信度为MinConf,筛选置信度不小于最小置信度的理财产品对列表,得到关联规则网络Net=[P,M,T];其中P为理财产品集合,即P=[p1,p2...pu],p为单个理财产品,u为理财产品总数;M为关联规则集合,即M=[m1,m2...mv],m为单条规则,形式为pi,pj,1,每条规则描述2个理财产品具有强关联关系,v为关联规则总数;T是理财产品描述标签的集合,即T=[t1,t2...tw],t为单条标签,w为标签总数,其中单个理财产品由s条标签描述,其中s的取值范围为[0,w];MinConf取各规则置信度的平均值或中位数;b协作关联采样:遍历关联规则网络中的每条关联规则m,去除掉关联规则本身自带的指向性,生成协作关联集合Cp;协作关联集合表示产品之间具有强关联;步骤如下:输入:关联规则网络Net=[P,M,T]2.1初始化Cp为空集2.2对于关联规则集合中的每一条关联规则2.2.1将关联规则按照理财产品ID由小到大排序后,赋值给临时变量cp;即cp←<pi,pj,1>i<j;2.2.2检查临时变量cp是否属于协作关联集合Cp;若不属于集合,则将cp加入Cp;即Cp←Cp∪{cp};返回Cp作为采样的协作关联集合;c竞争关联采样:对于任意两个不属于关联规则的理财产品pi,pj,组合生成竞争关联备选集合C0,表示产品之间具有竞争关系;C0中每条备选竞争关联c0的采样概率为按照此概率对C0进行随机欠采样,生成一个大小为L的子集L的取值与协作关联集合的大小一样;具体步骤如下:输入:关联规则网络Net=[P,M,T],竞争规则采样总数L,协作关联集合Cp3.1初始化竞争关联备选集合C0为空集3.2对于任意两个按照产品ID排序的理财产品3.2.1如果该理财产品组合不属于协作关联集合Cp,即则:3.2.1.1生成竞争关联,格式如pi,pj,-1,此处-1为标志位,表示此关联为竞争关联;将其赋值给临时变量c0;即c0←pi,pj,-1i<j3.2.1.2检查c0是否属于C0,若不属于竞争关联备选集合,则将该竞争关联加入C0;即C0←C0∪{c0}返回C0作为竞争关联备选集合;3.3对3.2步最终生成的竞争关联备选集合C0进行随机欠采样,定义对于集合C0中每条竞争关联c0的采样概率为随机采样为一个大小为L的集合其中Nor是归一化系数,以保证productc0为竞争关联c0=pi,pj,-1的热度积,其定义为productc0=poppi*poppj,此处popp表示理财产品p的热度,即为用户对理财产品产生行为的次数;timec0为竞争关联c0=<pi,pj,-1>的冷却时间,其定义为timec0=now-maxdatepi,datepj,其中datep表示理财产品p的发布时间,maxdatepi,datepj表示两个产品中发布时间比较晚的时间点,now表示当前时间点;返回CL作为竞争关联集合;d产生备选关联规则:首先,通过关联采样得到一个均衡的训练关联集C=Cp∪CL;如果训练关联集C中至少存在一个关联服从某规则r,则此规则就被视为备选规则;例如有一规则r为:用户喜欢购买同一银行的理财产品;若C中有产品对pi,pj,1或pi,pj,-1,pi和pj的银行属性标签属于同一银行,则r作为备选规则;关联集C相应的完全备选关联规则集表示为即将产品的标签和标签数量都符合的关联规则r加入备选关联规则集中;定义关联规则r的支持度为suppr;suppr为集合C中服从该规则的理财产品关联数量,即定义关联规则r的显著度为sigr;sigr为关联集C中服从该规则的理财产品的协作关联数量与竞争关联数量的差值,和协作关联与竞争关联之和的比值,即如果规则r是协作关联规则,那么r满足的理财产品协作关联数量不少于竞争关联数量,即sigr不小于零;反之规则r是竞争关联规则;基于关联规则的支持度和显著度,提出可靠的理财产品关联规则备选集生成算法:输入:理财产品关联集合C=Cp∪CL,最小的关联规则支持度MinSupp和最小的关联规则显著度MinSig;4.1初始化备选关联规则集为空集可靠备选关联规则集Rc为空集4.2对于每个理财产品关联c=p1,p2,1∈C或c=p1,p2,-1∈C:4.2.1将符合关联c的规则r加入备选关联规则集即4.3对于每一条理财产品关联规则4.3.1如果规则r的支持度suppr不小于最小支持度MinSupp;即suppr≥MinSupp,且置信度sigr的绝对值不小于最小置信度MinSig,即|sigr|≥MinSig,则:4.3.1.1将规则r加入可靠备选关联规则集Rc,即Rc←Rc∪{r}返回Rc作为可靠的备选理财产品关联规则集;MinSupp的设定是平均值或中位数,若为小数则向下取整,即只选取整数位;MinSig的设定显著度绝对值的平均值或中位数,若为小数则向下取整,即只选取整数位;e关联规则树模型的训练:定义关联规则树是一个二叉树,其中每个非叶子节点包含一条理财产品关联,而每个叶子节点中含有理财产品关联的标签;1表示协作关联,-1表示竞争关联;关联规则树的训练过程程如下:输入:训练关联集C=Cp∪CL,可靠备选规则集Rc和树的最大深度d;格式如RuleTreeC,Rc,d;5.1如果竞争关联集合CL为空集,即且C=Cp,则:返回一棵单节点的树,根节点为1;5.2如果协作关联集合Cp为空集,即且C=CL,则:返回一棵单节点的树,根节点为-1;5.3如果可靠备选关联规则集即d=0,则:返回一棵单节点的树,根节点符号和集合C中数量最多类别的产品关联相同,数量相同时观察父节点规则;父节点规则为协作规则时节点符号定为1,为竞争规则时节点符号定为-1;5.4选择最优关联规则r∈Rc,使得样本集熵HC+,C-最小,当熵最小时,样本分类准确率最高;5.5将符合规则r的样本赋值给集合变量C+,作为关联规则树的左子树样本集输入,即5.6将不符合规则r的样本赋值给集合变量C-,作为关联规则树的右子树样本集输入,即C-←C-C+;返回一棵关联规则树,其根节点为r,左子树为RuleTreeC+,Rc-{r},d-1,右子树为RuleTreeC-,Rc-{r},d-1;然后递归调用RuleTree算法进行处理;每个候选规则训练数据集分成两个子集,满足规则的产品关联的C+和剩下的产品关联C-;其结果的熵是: 选择最优的关联规则r使得熵HC+,C-最小,即分类准确度最高;并将r作为树的根节点,递归在集合C+和C_上调用RuleTree算法;所构建的每一棵关联规则树的深度都被限制为1,即每棵树仅包含一个规则作为其根节点,以及标记为1和-1的两个叶子节点;在主循环的每次迭代中,RuleScore基于当前权重的理财产品关联训练集训练一个深度为1的关联规则树,然后更新该规则树的分类情况计算该规则树的评分,并更新训练样本的权重;正值评分的规则表示协作规则,负值评分的规则表示竞争规则;RuleScore算法具体步骤如下:输入:均衡的训练样本集C=Cp∪CL和可靠备选规则集Rc,以及最大的迭代次数Q;6.1初始化所有理财产品关联的权重此处accountC为样本集C的总数;6.2初始化所有备选规则的评分为Scorec=0;6.3在第qq=1,…,Q次迭代中:6.3.1基于样本权重Dqc训练关联规则树γqr=RuleTreeC,Rc,1,其根节点为r;6.3.2计算γqr对于C的错误分类率此处errorc为关联规则树对样本的分类错误数量,accountC为样本总数量;6.3.3计算规则树的得分αq=0.5ln1-εqεq,εq=0时,αq=1;6.3.4更新规则得分:Scorer=Scorer+αq;6.3.5对于每个被γqr正确分类的样本c,更新样本权重为6.3.6对于每个被γqr错误分类的样本c,更新样本权重为6.3.7归一化样本集C使得总权重∑c∈CDq+1c=1;返回所有关联规则的评分基于关联规则的产品组合预测:对于一个关联规则r∈rc,如果符合该规则的协作关联样本权重之和不小于竞争关联样本权重之和,则r是一个协作关联规则,反之r是一个竞争关联规则;考虑两个理财产品pi,pj∈P,那么可靠备选规则集合Rc中满足理财产品关联c=pi,pj,fpi,pj的规则集合为此处fpi,pj为两个产品的可组合性评分;计算理财产品pi,pj的可组合性评分fpi,pj的预测值为如果Rpi,pj中的协作规则越多,则f*pi,pj的值越大;如果Rpi,pj中的竞争规则越多,则f*pi,pj的值越小;因此,如果fpi,pj的预测值f*pi,pj>0,则两个理财产品pi,pj进行组合;反之不适合构建产品组合。

全文数据:

权利要求:

百度查询: 北京比财数据科技有限公司 一种考虑竞争模式的关联挖掘算法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。