买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于用户画像和聚类技术识别机票异常搜索用户方法及系统_深圳市活力天汇科技股份有限公司_202410003978.7 

申请/专利权人:深圳市活力天汇科技股份有限公司

申请日:2024-01-03

公开(公告)日:2024-04-19

公开(公告)号:CN117520994B

主分类号:G06F18/2433

分类号:G06F18/2433;G06F18/23213;G06F18/2415

优先权:

专利状态码:有效-授权

法律状态:2024.04.19#授权;2024.02.27#实质审查的生效;2024.02.06#公开

摘要:本发明公开一种基于用户画像和聚类技术识别机票异常搜索用户方法及系统,属于大数据处理及计算机人工智能领域;其包括:构建异常搜索用户画像标签;根据异常搜索用户画像标签,获取异常搜索用户行为信息;根据异常搜索用户行为信息,得到待识别用户集;根据异常搜索用户画像标签,对待识别用户集进行聚类分析,得到聚类结果;对聚类结果进行后验,得到机票异常搜索用户。本发明能更有效、准确性更高和成本更低的识别非正常机票搜索用户。

主权项:1.基于用户画像和聚类技术识别机票异常搜索用户方法,其特征在于,包括以下步骤:构建异常搜索用户画像标签;根据异常搜索用户画像标签,获取异常搜索用户行为信息;根据异常搜索用户行为信息,得到待识别用户集;根据异常搜索用户画像标签体系和待识别用户集,构建用户标签体系矩阵;对画像标签体系矩阵进行优化处理,得到优化后矩阵;根据轮廓系数法确定聚类个数K:以优化后矩阵作为用户点,所述轮廓系数的计算公式为: ;dis_a即用户点到所属同簇内用户点的平均距离,表示为凝聚度;dis_b即用户点到所属非同簇内用户点的平均距离,表示为分离度;随机选择一个点作为第一个聚类中心,然后选择距离该点最远的那个点作为第二个聚类中心,然后再选择距离前两个点的最近距离最大的点作为第三个聚类中心,以此类推,直至选出K个聚类中心为止;计算优化后矩阵与各个初始聚类中心的距离,根据距离对所有优化后矩阵进行划分;分别计算K个聚类簇中特征的均值,将所述均值作为新的聚类中心;直至聚类收敛,得到聚类结果;对聚类结果进行后验,得到机票异常搜索用户;所述距离的计算公式为:d=;式中:ai和aj表示不同的两个用户,m表示用户的标签体系维度;所述聚类收敛目标为:采用损失函数作为聚类收敛的目标函数,其目标为使得划分类后各簇内误差平方和SSE最小:SSE=; ;式中:ei是k个聚类中心的第i个聚类中心的聚类中心点,Ei为第i个类的待识别用户集合,a是第i个类中用户的标签体系矩阵向量;在损失函数变化低于最小误差平方和t,且当前迭代次数大于最大迭代次数s时,聚类收敛。

全文数据:

权利要求:

百度查询: 深圳市活力天汇科技股份有限公司 基于用户画像和聚类技术识别机票异常搜索用户方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。