买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于谱聚类算法的惠企事项推送方法_中电万维信息技术有限责任公司_202311642623.4 

申请/专利权人:中电万维信息技术有限责任公司

申请日:2023-12-04

公开(公告)日:2024-02-23

公开(公告)号:CN117591754A

主分类号:G06F16/9536

分类号:G06F16/9536;G06F16/9535;G06F18/22;G06N5/022;G06F18/2323

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.12#实质审查的生效;2024.02.23#公开

摘要:本发明涉及数据智能推送技术领域,具体涉及一种基于谱聚类算法的惠企事项推送方法。本发明通过建立惠企事项数据库和企业数据库,分析企业用户行为,确定出企业‑事项矩阵,为了避免企业‑事项矩阵过于稀疏,进一步建立企业‑事项类别矩阵。根据企业‑事项类别矩阵得出企业的向量表示,通过余弦相似度计算方法计算出基于企业‑事项类别矩阵的企业相似度。通过基于企业‑事项类别矩阵的企业相似度和基于企业基本信息的企业相似度确定企业之间的关联图谱。通过谱聚类模型对关联图谱中的企业节点进行聚类,生成不同的类簇群体。最后,在企业对应的类簇群体中根据兴趣度预测值的大小确定出惠企事项推荐列表。

主权项:1.一种基于谱聚类算法的惠企事项推送方法,其特征在于包括如下步骤:一、建立企业-事项类别兴趣矩阵(1)企业-事项兴趣指数计算通过对企业用户的浏览、搜索、收藏等行为进行量化分析,不同行为对兴趣指数的影响程度不同,企业-事项兴趣指数计算如式(1)所示: 1上式表示企业a对事项j的兴趣度指数,n为企业行为类型数,αi为第i类行为对应的行为权重,bi表示第i类行为的出现次数;(2)企业-事项类别兴趣矩阵针对上述企业-事项兴趣指数矩阵稀疏的问题,提出企业-事项类别兴趣指数的计算方法,如式(2)所示: (2)Ta,s表示企业a对s类事项的兴趣指数,式中Ea,i为企业a对事项i的兴趣指数,ns为第s类事项中企业a操作的事项数,m为企业a操作的事项类型数,nj表示第j类事项中企业a操作的事项数;二、企业关联图谱绘制通过上述企业-事项类别兴趣矩阵得到企业的向量表示形式,将矩阵的行向量作为企业的向量表示,则企业n可表示如下: 3其中,Tns为企业n对事项类型s的兴趣指数;由此可将企业之间相似性量化为计算向量之间相似度,通过向量余弦相似度计算公式可得企业A与企业B的相似度: (4)其中,sim的值为[-1,1],值越接近1说明两向量相似度越高;企业关联图谱由企业节点和企业之间的相似度组成,将相似度大于0的企业节点用边相连,其中各节点之间边的权重为企业相似度;三、企业谱聚类(1)构造企业相邻矩阵根据企业关联图谱构造出企业相邻矩阵,矩阵元素表示如下: 5其中G为企业关联图谱,li,j表示企业i和企业j之间的连线,simi,j为企业i与企业j的关联相似度,即关联边的权重;由此可知,企业相邻矩阵的对角线元素值为0;企业相邻矩阵如下所示: 6(2)计算企业度矩阵根据企业关联图谱中企业节点的关联边个数确定企业度矩阵,度矩阵元素表示如下: 7式中,ei为图谱中企业i的关联边条数;由上式可知,企业度矩阵为对角矩阵,对角线元素为每个企业节点的关联边个数,其余元素为0;企业度矩阵表示如下: 8 (3)谱聚类实现结合上述企业相邻矩阵和企业度矩阵,根据拉普拉斯矩阵的定义可得,企业拉普拉斯矩阵L表示如下: 9 式中,D为企业度矩阵,W为企业相邻矩阵;谱聚类算法思想基于谱图划分,将谱图中的节点看作聚类样本,各节点之间的关联边权重作为样本间的相似性,通过对图谱进行划分得到多个最优子图,图谱的划分原则为划分后的子图之间相似度足够小,每个子图内部各节点之间的相似度足够大,根据拉普拉斯矩阵特性,将图谱切割问题转化为计算拉普拉斯矩阵前k个最小特征值对应的特征向量,并对特征向量进行聚类的问题;根据矩阵扰动理论,若第k个特征值和第k+1个特征值的差值的绝对值越大,则由k个特征向量构成的向量空间越稳定,根据上述描述,得到谱聚类的实现过程如下:a.求解企业拉普拉斯矩阵的特征值λ1,λ2,…,λn;b.将特征值从小到大进行排列,即λ1λ2…λn,计算两个相邻特征值的差值∆λ=λk-λk+1,k=1,2,…,n,当∆λ为极大值时,取前k个特征值,k即为聚类数量;c.求解前k个特征值对应的特征向量C1,C2,…,Ck,将k个特征向量组成矩阵V;d.将矩阵V的每一行作为k维空间的一个样本点,结合k-means聚类算法理论,通过不断更新样本中心的位置,迭代计算各样本点与样本中心的欧式距离,直到簇中心位置收敛,即达到聚类效果结束聚类,最终得到聚类结果R1,R2,…,Rk;四、惠企事项推荐列表首先,通过查找被推荐企业Brec的所属类簇,类簇中的企业集合为B={B1,B2,…,Bn},通过企业-事项矩阵和企业相似度计算公式重新计算被推荐企业Brec与所属同一类簇企业之间的相似度,根据相似度大小取前m个企业作为被推荐企业Brec的邻近企业集合Bner,然后,列举出邻近企业中的企业操作过的事项集合P={P1,P2,…,Pt},依次计算被推荐企业Brec对邻近企业事项集合中每项事项的预测兴趣度,最后,将企业Brec对事项集合中每项事项的预测兴趣度排序得到企业Brec最感兴趣的事项集合列表,按照列表为企业Brec进行事项推送,企业Brec对事项t的预测兴趣度I计算如下: (10)式中Em,t为企业m对事项t的兴趣指数,可通过式(1)得到,simrec,m为被推荐企业Brec与企业m的相似度,可根据式(2)所得,Bner表示被推荐企业的邻近企业集合,P表示邻近企业操作过的事项集合。

全文数据:

权利要求:

百度查询: 中电万维信息技术有限责任公司 一种基于谱聚类算法的惠企事项推送方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。