买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】用户行为分析方法、装置、计算设备及存储介质_中国移动通信集团湖北有限公司;中国移动通信集团公司_201711490905.1 

申请/专利权人:中国移动通信集团湖北有限公司;中国移动通信集团公司

申请日:2017-12-30

公开(公告)日:2021-06-08

公开(公告)号:CN109993556B

主分类号:G06Q30/02(20120101)

分类号:G06Q30/02(20120101);G06K9/62(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.06.08#授权;2019.08.02#实质审查的生效;2019.07.09#公开

摘要:本发明实施例公开了一种用户行为分析方法、装置、计算设备及存储介质,该方法包括:基于多个用户特征数据,构建基于第一特征维度和第二特征维度的二维特征矩阵,多个用户特征数据包括多个特征,多个特征包括第一特征和第二特征;对二维特征矩阵进行因子分析,以将多个用户特征数据分别投影在第一特征域和第二特征域的因子载荷平面上;以及对因子载荷平面上的投影点进行聚类分析,以提取用户行为模式特征。本方案通过将用户数据与网络性能结合在一起,能够提取潜在的用户行为特征,进而能够评估出用户行为对网络指标的影响。

主权项:1.一种用户行为分析方法,其特征在于,所述方法包括:基于多个用户特征数据,构建基于第一特征维度和第二特征维度的二维特征矩阵,所述用户特征数据包括多个特征,所述多个特征包括第一特征和第二特征;对所述二维特征矩阵进行因子分析,以将所述多个用户特征数据分别投影在第一特征域和第二特征域的因子载荷平面上;以及对所述因子载荷平面上的投影点进行聚类分析,以提取用户行为模式特征;所述方法还包括:基于所述多个用户特征数据,分别计算所述多个特征与网络指标之间的相关系数;以及选择所述相关系数不低于预定阈值的特征作为待分析特征;所述基于多个用户特征数据,构建基于第一特征维度和第二特征维度的二维特征矩阵,包括:从所述待分析特征中选择多组所述第一特征和所述第二特征,以分别构建所述二维特征矩阵。

全文数据:用户行为分析方法、装置、计算设备及存储介质技术领域本发明涉及无线网络优化技术领域,尤其涉及一种用户行为分析的方法、装置、计算设备及存储介质。背景技术近年来移动通信技术飞速发展,移动业务渗入到人们生活的各方各面,移动业务使用便捷,为人们提供了工作和生活的便利。现有的用户行为识别方法主要包括利用手机的加速度传感器所采集的行为信号在不同佩戴位置的特征来识别用户行为;收集用户的基础业务信息,以历史数据为基础推算转移率,得出迁出转移率的转移矩阵,并应用马尔可夫模型对时间间隔点上的各类人员分布情况进行预测;根据移动用户的日志记录以及对应的基站标号和地理位置,从若干个维度提取多种基本特征指标,并利用K-means聚类方法将移动用户区分成规律通话型、随机上网型、居家节约型和随机高消费型等用户模型;根据终端设备产生的用户数据,通过对兴趣点语义和行为模式进行分析,来执行用户行为的兴趣相似性计算和移动用户的位置预测。上述各方法存在以下缺陷:运营商无法获取终端中存储的信息;基于马尔科夫的分析模型在实际预测时受各种因素的影响,人员转移率很难准确确定,从而影响预测结果的准确性;用户业务行为模型的划分没有结合考虑网络性能;基于兴趣点的移动用户行为预测方法无法对未识别的潜在兴趣关联进行提取。传统的基于移动基站展开的固态基站分析方案已经无法满足用户个性化的需求,因此,需要一种基于与网络指标密切相关的用户行为分析的方法。发明内容针对用户业务行为模型的划分没有结合考虑网络性能的问题,本发明实施例提供了一种用户行为分析方法、装置、计算设备及存储介质,通过将用户行为和网络性能特征进行关联分析,挖掘强关联特征量,能够提供更准确的用户行为分析。第一方面,本发明实施例提供了一种用户行为分析方法,方法包括:基于多个用户特征数据,构建基于第一特征维度和第二特征维度的二维特征矩阵,用户特征数据包括多个特征,其中,多个特征包括第一特征和第二特征;对二维特征矩阵进行因子分析,以将多个用户特征数据分别投影在第一特征域和第二特征域的因子载荷平面上;以及对因子载荷平面上的投影点进行聚类分析,以提取用户行为模式特征。优选地,该方法还包括:分别计算多个特征与网络指标之间的相关系数,选择相关系数不低于预定阈值的特征作为待分析特征。优选地,相关系数可以是R系数或斯皮尔曼等级相关系数或γ系数。优选地,从待分析特征中选择多组第一特征和第二特征,以分别构建二维特征矩阵。优选地,用户特征数据是MDT数据。优选地,待分析特征可以包括时间、位置、非时空类特征,非时空类特征是从MDT数据中提取的除了时间和位置以外的特征,其中,多组第一特征和第二特征包括以下特征组合中的至少一种:时间和位置;时间和非时空类特征;位置和非时空类特征;两个不同的非时空类特征。优选地,可以使用对应分析法对二维特征矩阵进行因子分析。优选地,可以将二维特征矩阵基于第一特征域进行分解,得到第一域特征向量和第一域特征值;以及或者将二维特征矩阵基于第二特征域进行分解,得到第二域特征向量和第二域特征值。优选地,可以基于最大的预定数量的第一域特征值分别对应的第一域特征向量,得到第一域因子载荷矩阵;以及或者基于最大的预定数量的第二域特征值分别对应的第二域特征向量,得到第二域因子载荷矩阵。优选地,可以以两个第一域特征向量作为第一特征域的第一主因子轴,构建第一因子载荷平面;以及或者以两个第二域特征向量作为第二特征域的第二主因子轴,构建第二因子载荷平面。优选地,计算多个用户特征数据在因子载荷平面上的投影点两两之间的距离,以对多个用户特征数据进行聚类或分类。第二方面,本发明实施例提供了一种用户行为分析装置,装置包括:构建模块、因子分析模块和聚类分析模块。构建模块可以基于多个用户特征数据,构建基于第一特征维度和第二特征维度的二维特征矩阵,用户特征数据包括多个特征的特征量,多个特征包括第一特征和第二特征。因子分析模块可以对构建模块构建的二维特征矩阵进行因子分析,以将多个用户特征数据分别投影在第一特征域和第二特征域的因子载荷平面上。聚类分析模块可以对因子载荷平面上的投影点进行聚类分析,以提取用户行为模式特征。第三方面,本发明实施例提供了一种计算设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。本发明实施例提供的用户行为分析方法、装置、计算设备及存储介质,通过将用户数据与网络性能结合在一起,能够提取潜在的用户行为特征,提供更准确的用户行为分析。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了根据本发明一实施例的用户行为分析方法的示意性流程图。图2示出了根据本发明一实施例的用户特征数据统计分布图。图3示出了根据本发明一实施例的第一特征域的因子载荷平面示意图。图4示出了根据本发明一实施例的第二特征域的因子载荷平面示意图。图5示出了根据本发明一实施例的用户特征数据统计分布图。图6示出了根据本发明一实施例的第一特征域的因子载荷平面示意图。图7示出了根据本发明一实施例的第二特征域的因子载荷平面示意图。图8示出了根据本发明一实施例的用户行为分析装置的示意性结构框图。图9示出了本发明实施例提供的计算设备的硬件结构示意图。具体实施方式下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。针对目前主要的用户行为分析方法中存在的不足,如多模型移动用户的行为识别方法获取的用户数据只存储在手机终端,运营商无法获取大量的用户数据;基于马尔可夫模型的用户行为分析模型是一种无后效性的随机过程分析,预测准确性不足;基于兴趣点的用户行为趋势分析方法,无法对未识别的潜在兴趣进行提取;以及用户业务行为分析方法没有将用户行为与网络性能结合。本发明提出一种基于MDT数据的用户行为分析方法,图1示出了根据本发明一实施例的用户行为分析方法的示意性流程图。如图1所示,在步骤S100中可以基于多个用户特征数据,构建基于第一特征维度和第二特征维度的二维特征矩阵,用户特征数据包括多个特征,其中,多个特征包括第一特征和第二特征。根据本发明一实施例,用户特征数据可以是MDT数据。其中,MDT数据即最小化路测数据,是基于商用终端的测量报告。MDT为运营商通过商用终端收集无线网络的动态波动过程提供可能,为网络优化、分析、诊断过程提供全面的参考视图。其中,终端具备无线环境测量、典型事件测量、位置信息测量的能力,其支持的测量项包括:RSRP参考信号接收功率RSRQ参考信号的接收质量、PowerHeadroomUE发射功率余量、RIP接收干扰功率测量、下行上行数据吞吐量、下行上行调度IP吞吐率、下行上行数据包时延测量、下行上行数据丢包率测量、时间信息及对应的位置信息等。用户特征数据可以是从上述MDT数据中提取的多种数据信息。由于MDT数据能够采集的特征量种类较多,特征量与网络指标的关联性不同,有些较强有些较弱,因此,在进行用户行为分析前,可以对特征量进行关联性分析,保留强相关特征。根据本发明一实施例,可以分别计算多个特征与网络指标之间的相关系数,选择相关系数不低于预定阈值的特征作为待分析特征。为了描述方便,可以将异常数据剔除、并归一化处理后的不同特征均用变量Mi表示,例如M1表示RSRP,M2表示RSRQ。设Mi为特征,Nj为关键网络指标,提取某时间段t内的采样数据,进行关联分析,选出相关系数rMi,Nj大于预定阈值的特征作为待分析特征Kn。可以通过下述公式计算相关系数rMi,Nj:其中,rMi,Nj即R系数,为所有特征的平均值,为所有关联网络指标的平均值。也可采用斯皮尔曼等级相关系数、γ系数等进行关联分析,斯皮尔曼等级相关系数:式中di=xi-yi,i=1,2,…,NN为次数。等级相关系数R具有与简单直线相关相同的性质,取值范围在〔-1,+1〕之间;R的绝对值愈大,变量间的等级相关程度愈大。γ系数:式中Ns为同序对数目,Nd为异序对数目。适用于次数N很大的情况,γ系数的取值范围在〔-1,+1〕之间。γ的绝对值越大,变量间的等级相关程度越大。根据本发明一实施例,待分析特征可以包括时间、位置、非时空类特征,非时空类特征是从MDT数据中提取的除了时间和位置以外的特征,多组第一特征和第二特征包括以下特征组合中的至少一种:时间和位置;时间和非时空类特征;位置和非时空类特征;两个不同的非时空类特征。确定待分析的特征Kn之后,可根据不同特征构建二维特征矩阵。根据本发明一实施例,可以从待分析特征中选择多组第一特征和第二特征,以分别构建二维特征矩阵。本发明提供四种维度的特征矩阵,分别是时间-经纬度维度、时间-特征维度、经纬度-特征维度、特征-特征维度。1时间-经纬度维度。提取MDT数据中的时间、经纬度信息,对经纬度数据进行复处理,构建每个用户的时间-经纬度二维特征矩阵。2时间-特征维度。提取MDT数据中的时间、某一特征信息,可对特征进行适当的聚合汇总,例如某用户24小时的特征变化、某栅格内所有用户的24小时特征变化,构建时间-特征二维特征矩阵。3经纬度-特征维度。提取MDT数据中的经纬度、某一特征信息,对经纬度数据进行复处理,对特征进行适当的聚合汇总,构建经纬度-特征的二维特征矩阵。4特征-特征维度。提取MDT数据中的某两种不同的特征信息,构建特征-特征的二维特征矩阵。以上述及的特征为非时空类特征,例如无线信号测量值、接收功率值等。可以将时间、经纬度可以定义为一种特殊的特征,上述四种二维特征矩阵可简化为矩阵AM*N。当M为时间、N为经纬度时,AM*N表示时间-经纬度维度;当M为时间、N为非时空类特征时,AM*N表示时间-特征维度。在步骤S200中可以对二维特征矩阵进行因子分析,以将多个用户特征数据分别投影在第一特征域和第二特征域的因子载荷平面上。其中,第一特征域是指以第一特征中提取的因子为坐标轴,第二特征域是指以第二特征中提取的因子为坐标轴。因子分析利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。根据本发明一实施例,可以使用对应分析法对二维特征矩阵进行因子分析。其中,对应分析方法一般用于多元变量统计分析,其基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。通过因子分析可以从因子载荷图上对特征进行直观的分类,而且能够指示分类的主要参数主因子以及分类的依据。根据本发明一实施例,可以将二维特征矩阵基于第一特征域进行分解,得到第一域特征向量和第一域特征值;以及或者将二维特征矩阵基于第二特征域进行分解,得到第二域特征向量和第二域特征值。例如,可以将二维特征矩阵AM*N的M维和N维看作是对应分析中的变量和样本。根据对应分析理论,对特征矩阵在两个不同的域进行特征分解:I、Q表示对特征矩阵AM*N的M域和N域分别进行特征分解,U表示M域特征矢量,即第一域特征向量,V表示N域特征矢量,即第二域特征向量,Λ表示第一域特征值或第二域特征值,H表示共轭转置。第一域特征值和第二域特征值在两式中的个数是不同的,但两式Λ中的非零特征值相同,且存在以下关系:其中λk为第k个特征值,Uk、Vk为其对应的特征矢量。根据本发明一实施例,可以基于最大的预定数量的第一域特征值分别对应的第一域特征向量,得到第一域因子载荷矩阵;以及或者基于最大的预定数量的第二域特征值分别对应的第二域特征向量,得到第二域因子载荷矩阵。例如,可以根据累计贡献率因子分析中抽取出的因子特征值之和和所有因子特征值之和的比值对特征值进行排序λ2≥λ2≥……≥λk,取前k个特征值对应的特征向量:其中,第一域因子载荷矩阵即为G=[um1,um2,…,umk]n1=1,2,...,M,第二域因子载荷矩阵即为F=[vn1,vn2,…,vnk]n=1,2,…,N根据本发明一实施例,可以以上述矩阵中前两个第一域特征向量作为第一特征域的第一主因子轴,构建第一因子载荷平面;以及或者以上述矩阵中前两个第二域特征向量作为第二特征域的第二主因子轴,构建第二因子载荷平面。例如,将特征矩阵分解为M域和N域,提取M域中的两个特征因子绘制M域因子平面图,提取N域两个特征因子绘制N域因子平面图。例如,根据主因子分析法,可以取特征值最大的两项作为主因子轴:这样,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标主因子,即每个主因子都是原始变量的线性组合,且各个主因子之间互不相关,使得主因子比提取的用户特征数据具有某些更优越的性能。在步骤S300中,可以对因子载荷平面上的投影点进行聚类分析,以提取用户行为模式特征。例如,可以将二维特征矩阵AM*N的M域特征和N域特征分别投影在各自域的因子载荷平面上,也可以投影在同一个平面内,通过分析各个投影点之间的位置关系,确定不同特征之间的联系与区别。其中,聚类分析是数值分类学的一个分支,是研究样本类别相似程度的一种多元统计方法,根据一定的准则研究样本能否分类、能分几类等问题。聚类将数据分类到不同的簇,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类可分为层次聚类和非层次聚类,可以采用k-均值、k-中心点等算法、系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等进行聚类分析。投影在因子平面上的点代表着M域和N域上的特征,可以从平面上点的分布情况,分析用户行为模式特征。可以采用层次聚类法提取用户行为模式特征。根据本发明一实施例,可以计算多个用户特征数据在因子载荷平面上的投影点两两之间的距离,以对多个用户特征数据进行聚类或分类。以M域fnx,fny为例进行方法说明,聚类分析的步骤如下:将每一个fnx,fny作为一个独立的簇点集合,利用欧拉距离计算每个簇之间的邻近度也可以使用闵可夫斯基距离、Mahalanobis距离等距离度量方法,计算每个簇之间的邻近度。合并最近接近的两个簇,并计算新的邻近度矩阵。重复上述过程,直到仅剩下一个簇。观察聚类效果,选择合适的簇层确定行为模式。聚类之后的采样点具有相同的行为模型,行为模型与构建特征矩阵的待分析特征有关。以时间-经纬度维度为例,投影在M域因子平面上点代表用户的时间特征信息,投影在N域因子平面上的点代表用户的经纬度的特征信息。具有相似时间、经纬度特征的用户,会在因子平面上紧密的汇聚在一起,聚类则可以将这类用户识别出来。下面以具体案例对本发明方案进行解释说明。图2示出了根据本发明一实施例的用户特征数据统计分布图。如图2所示,以某高校业务量分析为例,构造二维特征矩阵AM×N,其中M表示24h时间变化,N表示栅格编号,AM×N的值表示M时刻N栅格内的业务量产品产量或销售量。第一特征域为栅格域,第二特征域为时间域。对二维特征矩阵AM×N在第一特征域栅格域和第二特征域时间域中进行特征分解,构建主因子轴的因子载荷平面,并在因子载荷平面上进行投影。图3示出了根据本发明一实施例的第一特征域的因子载荷平面示意图。图4示出了根据本发明一实施例的第二特征域的因子载荷平面示意图。如图3-图4所示,对特征矩阵在两个不同的域进行特征分解,构建M域和N域主因子轴,将主因子作为x坐标,次因子作为y坐标对M域和N域分别进行投影。如图3所示,以栅格域为例进行分析:1、使用k-均值聚类可以识别出两个明显的离群点,经查这两个站的业务量数据为空值,属于采集异常。2、使用层次聚类法可以将凝聚点分为两类内环内S1、内环外S2,这两类栅格的业务量分布特征各不同,需进行场景化分析。以某医院医生行为特征分析为例。图5示出了根据本发明一实施例的用户特征数据统计分布图。如图5所示,首先识别医生号码特征:常驻医院栅格且日均驻留时间约8小时的用户。构造二维特征矩阵AM×N,其中M表示用户,N表示用户驻留过的栅格编号,AM×N的值用户M在N栅格内的驻留时长。仿真数据,用户编号49-50设置为离群点对二维特征矩阵AM×N在两个不同的域进行特征分解、构建主因子轴的因子载荷平面,并在因子平台进行投影,可以如下图的M域、N域特征。图6示出了根据本发明一实施例的第一特征域的因子载荷平面示意图。图7示出了根据本发明一实施例的第二特征域的因子载荷平面示意图。如图6-图7所示,对特征矩阵在两个不同的域进行特征分解,构建M域和N域主因子和次因子轴,将主因子作为x坐标,次因子作为y坐标,对M域和N域分别进行投影。由于是仿真数据,从图6和图7中仅能发现用户离群点两个。若采用实测数据,可使用聚类算法对所有点进行特征聚类,进而挖掘医生用户行为特征。综上所述,本方法通过将用户行为数据和网络性能指标进行关联分析,利用不同特征之间的特征因子分析用户行为模式。能够提取潜在的用户行为特征。图8示出了根据本发明一实施例的用户行为分析装置的示意性结构框图。如图8所示,该装置800可以包括构建模块810、因子分析模块820和聚类分析模块830。构建模块810可以基于多个用户特征数据,构建基于第一特征维度和第二特征维度的二维特征矩阵,用户特征数据包括多个特征的特征,多个特征包括第一特征和第二特征。因子分析模块820可以对构建模块810构建的二维特征矩阵进行因子分析,以将多个用户特征数据分别投影在第一特征域和第二特征域的因子载荷平面上。聚类分析模块830可以对因子载荷平面上的投影点进行聚类分析,以提取用户行为模式特征。根据本发明一实施例,该装置800还可以包括相关系数计算模块和选择模块。相关系数计算模块可以分别计算多个特征与网络指标之间的相关系数;选择模块可以选择相关系数不低于预定阈值的特征作为待分析特征。根据本发明一实施例,因子分析模块820可以包括第一分解单元和第二分解单元。第一分解单元可以将二维特征矩阵基于第一特征域进行分解,得到第一域特征向量和第一域特征值。第二分解单元可以将二维特征矩阵基于第二特征域进行分解,得到第二域特征向量和第二域特征值。根据本发明一实施例,因子分析模块820还可以包括第一获取单元和第二获取单元。第一获取单元可以基于最大的预定数量的第一域特征值分别对应的第一域特征向量,得到第一域因子载荷矩阵。第二获取单元可以基于最大的预定数量的第二域特征值分别对应的第二域特征向量,得到第二域因子载荷矩阵。根据本发明一实施例,因子分析模块820还可以包括第一构建单元和第二构建单元。第一构建单元可以以最大的两个第一域特征向量作为第一特征域的第一主因子轴,构建第一因子载荷平面。第二构建单元可以以最大的两个第二域特征向量作为所述第二特征域的第二主因子轴,构建第二因子载荷平面。根据本发明一实施例,聚类分析模块830可以包括距离计算单元。距离计算单元可以计算多个用户特征数据在因子载荷平面上的投影点两两之间的距离,以对多个用户特征数据进行聚类或分类。综上所述,本方案解决了目前无法利用合法手段获取用户定位信息的问题,将用户行为和网络性能特征进行关联分析,利用不同特征量之间的特征因子识别用户行为模式。将用户数据和网络性能结合在一起,能够提取潜在的用户行为特征,通过不同特征之间的关联分析,挖掘强关联特征,提供更准确的优化效果评估。另外,结合图1描述的本发明实施例的用户行为分析方法可以由计算设备来实现。图9示出了本发明实施例提供的计算设备的硬件结构示意图。计算设备可以包括处理器901以及存储有计算机程序指令的存储器902。具体地,上述处理器901可以包括中央处理器CPU,或者特定集成电路ApplicationSpecificIntegratedCircuit,ASIC,或者可以被配置成实施本发明实施例的一个或多个集成电路。存储器902可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器902可包括硬盘驱动器HardDiskDrive,HDD、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线UniversalSerialBus,USB驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器902可包括可移除或不可移除或固定的介质。在合适的情况下,存储器902可在数据处理装置的内部或外部。在特定实施例中,存储器902是非易失性固态存储器。在特定实施例中,存储器902包括只读存储器ROM。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROMPROM、可擦除PROMEPROM、电可擦除PROMEEPROM、电可改写ROMEAROM或闪存或者两个或更多个以上这些的组合。处理器901通过读取并执行存储器902中存储的计算机程序指令,以实现上述实施例中的任意一种用户行为分析方法。在一个示例中,计算设备还可包括通信接口903和总线910。其中,如图9所示,处理器901、存储器902、通信接口903通过总线910连接并完成相互间的通信。通信接口903,主要用于实现本发明实施例中各模块、装置、单元和或设备之间的通信。总线910包括硬件、软件或两者,将计算设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口AGP或其他图形总线、增强工业标准架构EISA总线、前端总线FSB、超传输HT互连、工业标准架构ISA总线、无限带宽互连、低引脚数LPC总线、存储器总线、微信道架构MCA总线、外围组件互连PCI总线、PCI-ExpressPCI-X总线、串行高级技术附件SATA总线、视频电子标准协会局部VLB总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线910可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。另外,结合上述实施例中的用户行为分析方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种用户行为分析方法。本发明方案解决了用户业务行为模型的划分没有结合考虑网络性能的技术问题。通过挖掘强关联特征,能够提取潜在的用户行为特征,以及评估出用户行为对网络指标的影响,实现联合优化,提供更准确的用户行为分析。需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路ASIC、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROMEROM、软盘、CD-ROM、光盘、硬盘、光纤介质、射频RF链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

权利要求:1.一种用户行为分析方法,其特征在于,所述方法包括:基于多个用户特征数据,构建基于第一特征维度和第二特征维度的二维特征矩阵,所述用户特征数据包括多个特征,所述多个特征包括第一特征和第二特征;对所述二维特征矩阵进行因子分析,以将所述多个用户特征数据分别投影在第一特征域和第二特征域的因子载荷平面上;以及对所述因子载荷平面上的投影点进行聚类分析,以提取用户行为模式特征。2.根据权利要求1所述的方法,其特征在于,所述方法包括:基于所述多个用户特征数据,分别计算所述多个特征与网络指标之间的相关系数;以及选择所述相关系数不低于预定阈值的特征作为待分析特征。3.根据权利要求2所述的方法,其特征在于,所述相关系数为R系数或斯皮尔曼等级相关系数或γ系数。4.根据权利要求2所述的方法,其特征在于,从所述待分析特征中选择多组所述第一特征和所述第二特征,以分别构建所述二维特征矩阵。5.根据权利要求2所述的方法,其特征在于,所述用户特征数据是MDT数据。6.根据权利要求5所述的方法,其特征在于,所述待分析特征包括时间、位置、非时空类特征,所述非时空类特征是从MDT数据中提取的除了时间和位置以外的特征,所述多组第一特征和第二特征包括以下特征组合中的至少一种:时间和位置;时间和非时空类特征;位置和非时空类特征;两个不同的非时空类特征。7.根据权利要求1所述的方法,其特征在于,所述对二维特征矩阵进行因子分析的步骤包括:使用对应分析法对所述二维特征矩阵进行因子分析。8.根据权利要求7所述的方法,其特征在于,所述使用对应分析法对所述二维特征矩阵进行因子分析的步骤包括:将所述二维特征矩阵基于所述第一特征域进行分解,得到第一域特征向量和第一域特征值;以及或者将所述二维特征矩阵基于所述第二特征域进行分解,得到第二域特征向量和第二域特征值。9.根据权利要求8所述的方法,其特征在于,所述使用对应分析法对所述二维特征矩阵进行因子分析的步骤还包括:基于最大的预定数量的第一域特征值分别对应的第一域特征向量,得到第一域因子载荷矩阵;以及或者基于最大的预定数量的第二域特征值分别对应的第二域特征向量,得到第二域因子载荷矩阵。10.根据权利要求8所述的方法,其特征在于,所述对二维特征矩阵进行因子分析以将所述多个用户特征数据分别投影在第一特征域和第二特征域的因子载荷平面上的步骤包括:以所述两个第一域特征向量作为所述第一特征域的第一主因子轴,构建第一因子载荷平面;以及或者以所述两个第二域特征向量作为所述第二特征域的第二主因子轴,构建第二因子载荷平面。11.根据权利要求10所述的方法,其特征在于,所述对因子载荷平面上的投影点进行聚类分析的步骤包括:计算所述多个用户特征数据在所述因子载荷平面上的投影点两两之间的距离,以对所述多个用户特征数据进行聚类或分类。12.一种用户行为分析装置,其特征在于,所述装置包括:构建模块,用于基于多个用户特征数据,构建基于第一特征维度和第二特征维度的二维特征矩阵,所述用户特征数据包括多个特征,所述多个特征包括第一特征和第二特征;因子分析模块,用于对所述二维特征矩阵进行因子分析,以将所述多个用户特征数据分别投影在第一特征域和第二特征域的因子载荷平面上;以及聚类分析模块,用于对所述因子载荷平面上的投影点进行聚类分析,以提取用户行为模式特征。13.一种计算设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-11中任一项所述的方法。14.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-11中任一项所述的方法。

百度查询: 中国移动通信集团湖北有限公司;中国移动通信集团公司 用户行为分析方法、装置、计算设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。