买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于半监督聚类集成学习的客户细分方法_杭州电子科技大学_202011117305.2 

申请/专利权人:杭州电子科技大学

申请日:2020-10-19

公开(公告)日:2024-04-09

公开(公告)号:CN112288465B

主分类号:G06Q30/0201

分类号:G06Q30/0201;G06F18/214;G06F18/2321;G06F18/25;G06F18/2413

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2021.02.23#实质审查的生效;2021.01.29#公开

摘要:本发明公开一种基于半监督聚类集成学习的客户细分方法,本发明首先收集客户的特征信息,将特征信息数字化,构建客户特征信息数据集;利用少量的标签样本来初始化聚类中心,并设置核模糊聚类算法的模糊度和高斯宽度两个参数,生成若干个差异性较大的基聚类;利用标签样本的聚类准确性来计算各基聚类的可信度;通过近邻法和各基聚类的可信度来构造质量函数;最后利用D‑S证据理论将质量函数进行证据融合,得到聚类结果。本发明将半监督集成学习引入到客户细分中,解决了算法参数敏感性的问题;利用了先验信息合理估计各基聚类的可信度,改变各基聚类在融合过程中所占的比重,解决了证据冲突问题,使得融合结果更加合理,提高了客户细分的准确性。

主权项:1.一种基于半监督聚类集成学习的客户细分方法,其特征在于,该方法具体包括以下步骤:步骤一:收集客户多个特征信息,将所有信息数字化,选取典型特征客户,作为先验信息,打上标签,构建客户信息数据集;步骤二:利用部分标签样本初始化各基聚类的聚类中心;步骤三:利用半监督核模糊聚类算法,对客户信息数据集进行聚类,生成若干个基聚类成员;步骤四:计算各基聚类中标签样本的聚类准确性AC,根据可信度计算公式,得到各基聚类的可信度CL; 其中α为可信度指数,h表示基聚类成员个数,AC={AC1,AC2,…,ACh};步骤五:通过近邻法,计算样本在各基聚类属于各个类的概率,并结合基聚类的可信度,生成质量函数;在所有基聚类中,统计任意两个样本分在同一个类别的次数,当大于一定次数时,这两个样本就具有相似性,则称为邻居样本;如果样本xi和样本xj是邻居关系,则S′ij=1,否则S′ij=0;定义样本xi在聚类成员q中的质量函数为具体形式如公式2所示: 式中表示的是满足在聚类成员q中,与样本xi属于邻居关系,且出现在簇k中的所有样本组成的集合,表示的是满足上述条件的个数,Θ表示全集;步骤六:最后利用D-S证据理论将步骤五生成的质量函数进行融合,得到样本属于每个类的概率,即将客户分成c个类,取概率最大的类作为样本的类别,完成最终的分类。

全文数据:

权利要求:

百度查询: 杭州电子科技大学 一种基于半监督聚类集成学习的客户细分方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。