买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于大数据分析的用户留存率预测方法及装置_中国平安人寿保险股份有限公司_201811130539.3 

申请/专利权人:中国平安人寿保险股份有限公司

申请日:2018-09-27

公开(公告)日:2024-04-05

公开(公告)号:CN109509017B

主分类号:G06Q30/0202

分类号:G06Q30/0202;G06Q30/0201;G06Q10/0639

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2020.11.06#实质审查的生效;2019.03.22#公开

摘要:本申请涉及大数据技术领域,具体揭示了一种基于大数据分析的用户留存率预测方法及装置、电子设备、存储介质。所述方法包括:为所在业务获取指定历史时间段内影响历史用户留存率的关键指标;从所述关键指标中选取至少一项进行所述关键指标的分组;根据所选取的关键指标在所述指定历史时间段内对所述历史用户留存率的影响程度,获得所在关键指标分组对应的历史留存率分布;在业务所进行目标时间段的用户留存率预测中,根据所对应画像标签将所满足关键指标分组对应的历史留存率分布作为用户在所述目标时间段的用户留存率。通过本申请所提供的方法可对互联网应用平台中的用户留存率进行准确预测。

主权项:1.一种基于大数据分析的用户留存率预测方法,其特征在于,包括:获取所在业务在指定历史时间段产生的历史用户数据;从所述历史用户数据中获取历史用户留存率满足预设留存阈值的历史用户;从所述历史用户的画像标签中选取若干与历史用户活跃度相关联的画像标签作为备选指标;根据所述备选指标对所述历史用户留存率的影响程度,对所述备选指标进行排序,选取指定排名下的所述备选指标作为影响所述历史用户留存率的关键指标;从所述关键指标中选取至少一项进行所述关键指标的分组;获取每一历史用户在所述指定历史时间段对应的历史用户留存率以及每一所述历史用户对应的关键指标;根据所述关键指标分组中的全部关键指标,获得满足所述全部关键指标所对应历史用户的历史用户留存率;将满足所述全部关键指标所对应历史用户的最小历史用户留存率和最大历史用户留存率作为所述关键指标分组对应的历史用户留存率分布的起始和末尾,得到所述关键指标分组对应的历史留存率分布;通过画像标签比对获得用户所满足的关键指标分组,并将所述用户所满足的关键指标分组对应的历史留存率分布作为所述用户在目标时间段的用户留存率。

全文数据:基于大数据分析的用户留存率预测方法及装置技术领域本申请涉及大数据技术领域,特别涉及一种基于大数据分析的用户留存率预测方法及装置、电子设备、计算机可读存储介质。背景技术在互联网行业中,特别是对于移动应用平台或游戏应用平台,平台的拥有者比较关心该平台中的用户留存率。用户留存率表示用户在互联网应用平台中留存的概率,往往体现了该平台的质量和保留用户的能力。目前,互联网应用平台中的用户留存率一般是采用比较单一的指标进行判断的,例如,根据平台当月用户的活跃天数来判断次月的用户留存率。但是,由于影响用户是否留存的原因往往是多样的,仅根据单一指标判断得出的用户留存率的准确度不高。因此,如何对互联网应用平台的用户留存率进行准确判断是现有技术中有待解决的问题。发明内容基于上述技术问题,本申请提供了一种基于大数据分析的用户留存率预测方法及装置、电子设备、计算机可读存储介质。本申请所揭示的技术方案包括:一种基于大数据分析的用户留存率预测方法,所述方法包括:为所在业务获取指定历史时间段内影响历史用户留存率的关键指标;从所述关键指标中选取至少一项进行所述关键指标的分组;根据所选取的关键指标在所述指定历史时间段内对所述历史用户留存率的影响程度,获得所在关键指标分组对应的历史留存率分布;在业务所进行目标时间段的用户留存率预测中,根据所对应画像标签将所满足关键指标分组对应的历史留存率作为用户在所述目标时间段的用户留存率。进一步地,所述为所在业务获取在指定历史时间段内影响历史用户留存率的关键指标,包括:获取所在业务在指定历史时间段产生的历史用户数据;从所述历史用户数据中获取历史用户留存率满足预设留存阈值的历史用户;根据所述历史用户的画像标签获取影响所述历史用户留存率的关键指标。进一步地,所述根据所述历史用户的画像标签获取影响所述历史用户留存率的关键指标,包括:从所述历史用户的画像标签中选取若干与历史用户活跃度相关联的画像标签作为备选指标;根据所述备选指标对所述历史用户留存率的影响程度,对所述备选指标进行排序,选取指定排名下的所述备选指标作为影响所述历史留存率的关键指标。进一步地,所述根据所述备选指标对所述历史用户留存率的影响程度,对所述备选指标进行排序,选取指定排名下的所述备选指标作为影响所述历史留存率的关键指标,包括:根据所述备选指标所对应的历史参与人数对所述备选指标进行排序,获取第一指定排名对应的第一指标;按照所述第一指标对应的历史用户留存率对所述第一指标进行排序,获取第二指定排名对应的第二指标;根据所述第二指标对应历史参与人数的差异值对所述第二指标进行排序,选取第三指定排名对应的所述第二指标作为所述关键指标。进一步地,所述根据所选取的关键指标在所述指定历史时间段内对所述历史用户留存率的影响程度,获得每一关键指标分组对应的历史留存率分布,包括:获取每一历史用户在所述指定历史时间段对应的历史用户留存率以及每一所述历史用户对应的关键指标;根据所述关键指标分组中的全部关键指标,获得满足所述全部关键指标所对应历史用户的历史用户留存率;将满足所述全部关键指标所对应历史用户的最小历史用户留存率和最大历史用户留存率作为所述关键指标分组对应的历史用户留存率分布的起始和末尾,得到所述关键指标分组对应的历史留存率分布。进一步地,所述基于大数据分析的用户留存率预测方法还包括:根据所在业务中用户在目标时间段的用户留存率,获取所述用户在所述目标时间段的留存等级。进一步地,所述为所在业务获取指定历史时间段内影响历史用户留存率的关键指标,包括:检测业务平台在所述指定历史时间段内是否存在历史更新;如果存在,获取所述指定历史时间段在所述历史更新的时间之后影响所述历史用户留存率的关键指标;如果不存在,则获取所述指定历史时间段内影响所述历史用户留存率的关键指标。一种基于大数据分析的用户留存率预测装置,所述装置包括:关键指标获取模块,用于为所在业务获取指定历史时间段内影响历史用户留存率的关键指标;关键指标分组模块,用于从所述关键指标中选取至少一项进行所述关键指标的分组;历史留存率分布获取模块,用于根据所选取的关键指标在所述指定历史时间段内对所述历史用户留存率的影响程度,获得所在关键指标分组对应的历史留存率分布;用户留存率获取模块,用于在业务所进行目标时间段的用户留存率预测中,根据所对应画像标签将所满足关键指标分组对应的历史留存率作为用户在所述目标时间段的用户留存率。一种电子设备,所述电子设备包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如前所述的基于大数据分析的用户留存率预测方法。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前所述的基于大数据分析的用户留存率预测方法。本申请的实施例提供的技术方案可以包括以下有益效果:在本申请中,通过获取历史时间段内影响历史用户留存率的关键指标,然后对获取的关键指标进行分组,并确定每一分组分别对应的历史留存率分布,使得在对目标时间段的用户留存率进行预测时,通过判断用户所对应的画像标签满足哪一关键指标分组,即可将所满足关键指标分组所对应的历史留存率分布作为用户在目标时间段的用户留存率。与现有技术相比,由于本申请中进行用户留存率判断的历史留存率分布是依据影响历史用户留存率的关键指标得来的,这些关键指标能够从多方面反映历史用户的留存情况,因此,采用本申请提供的方法能够对用户留存率进行更加准确的预测。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并于说明书一起用于解释本申请的原理。图1是根据一示例性实施例示出的一种计算机设备的硬件框图;图2是根据一示例性实施例示出一种基于大数据分析的用户留存率预测方法的流程图;图3是根据图2对应实施例示出的对步骤110进行描述的流程图;图4是根据图2对应实施例示出的对步骤150进行描述的流程图;图5是根据一示例性实施例示出的一种基于大数据分析的用户留存率预测装置的框图。通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。具体实施方式这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种计算机设备的框图。如图1所示,计算机设备可以包括以下一个或者多个组件:处理组件101,存储器102,电源组件103,多媒体组件104,音频组件105,传感器组件107以及通信组件108。其中,上述组件并不全是必须的,计算机设备可以根据自身功能需求增加其他组件或减少某些组件,本实施例不作限定。处理组件101通常控制计算机设备的整体操作,诸如与显示,电话呼叫,数据通信,相机操作以及日志数据处理相关联的操作等。处理组件101可以包括一个或多个处理器109来执行指令,以完成上述操作的全部或部分步骤。此外,处理组件101可以包括一个或多个模块,便于处理组件101和其他组件之间的交互。例如,处理组件101可以包括多媒体模块,以方便多媒体组件104和处理组件101之间的交互。存储器102被配置为存储各种类型的数据以支持在计算机设备的操作。这些数据的示例包括用于在计算机设备上操作的任何应用程序或方法的指令。存储器102可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如SRAMStaticRandomAccessMemory,静态随机存取存储器,EEPROMElectricallyErasableProgrammableRead-OnlyMemory,电可擦除可编程只读存储器,EPROMErasableProgrammableReadOnlyMemory,可擦除可编程只读存储器,PROMProgrammableRead-OnlyMemory,可编程只读存储器,ROMRead-OnlyMemory,只读存储器,磁存储器,快闪存储器,磁盘或光盘。存储器102中还存储有一个或多个模块,该一个或多个模块被配置成由该一个或多个处理器109执行,以完成以下任一所示方法中的全部或者部分步骤。电源组件103为计算机设备的各种组件提供电力。电源组件103可以包括电源管理系统,一个或多个电源,及其他与为计算机设备生成、管理和分配电力相关联的组件。多媒体组件104包括在所述计算机设备和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括LCDLiquidCrystalDisplay,液晶显示器和TPTouchPanel,触摸面板。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。音频组件105被配置为输出和或输入音频信号。例如,音频组件105包括一个麦克风,当计算机设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器102或经由通信组件108发送。在一些实施例中,音频组件105还包括一个扬声器,用于输出音频信号。传感器组件107包括一个或多个传感器,用于为计算机设备提供各个方面的状态评估。例如,传感器组件107可以检测到计算机设备的打开关闭状态,组件的相对定位,传感器组件107还可以检测计算机设备或计算机设备一个组件的坐标改变以及计算机设备的温度变化。在一些实施例中,该传感器组件107还可以包括磁传感器,压力传感器或温度传感器。通信组件108被配置为便于计算机设备和其他设备之间有线或无线方式的通信。计算机设备可以接入基于通信标准的无线网络,如WiFiWireless-Fidelity,无线网络,2G或3G,或它们的组合。在一个示例性实施例中,通信组件108经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件108还包括NFCNearFieldCommunication,近场通信模块,以促进短程通信。例如,在NFC模块可基于RFIDRadioFrequencyIdentification,射频识别技术,IrDAInfraredDataAssociation,红外数据协会技术,UWBUltra-Wideband,超宽带技术,BTBluetooth,蓝牙技术和其他技术来实现。在示例性实施例中,计算机设备可以被一个或多个ASICApplicationSpecificIntegratedCircuit,应用专用集成电路、DSPDigitalSignalProcessing,数字信号处理器、PLDProgrammableLogicDevice,可编程逻辑器件、FPGAField-ProgrammableGateArray,现场可编程门阵列、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。本实施例中的计算机设备中处理器执行操作的具体方式将在有关基于大数据分析的用户留存率预测方法的实施例中进行详细描述,此处将不做详细阐述说明。图2是根据一示例性实施例示出的一种基于大数据分析的用户留存率预测方法的流程图,该方法适用于图1所示的计算机设备。如图2所示,该方法可以包括以下步骤:在步骤110中,为所在业务获取指定历史时间段内影响历史用户留存率的关键指标。其中,所在业务为将要进行用户留存率预测的互联网应用平台,例如前述的移动应用平台、游戏应用平台,也或者是其他的互联网应用平台,本实施例对此不进行限定。指定历史时间段所表示的是,自当前进行用户留存率预测的时间点为起始,往前定位的历史时间段,其可以是指定连续的某几个历史月份,或者是指定连续的历史天数,也或者是其他任意的历史时间段,本实施例对此仍不进行限定。获取在指定时间段内影响历史用户留存率的关键指标具体为,在指定历史时间段内,通过对每一历史用户的画像标签与其对应的历史用户留存率进行分析和统计,以得到对历史用户留存率影响程度较高的画像标签,并将所得的画像标签作为影响历史用户留存率的关键指标。其中,历史用户表示的是,指定历史时间段内在所要进行用户留存率预测的互联网应用平台上活跃的用户,这些历史用户中的部分或者全部在指定历史时间段之后仍可继续在该平台活跃。对每一历史用户来说,历史用户的画像标签和对应的历史用户留存率均可通过历史用户数据获取,因此,在本实施例中,可将每一历史用户的画像标签和其对应的历史用户留存率视为通过现有技术所获取的特征。需要说明的是,在本实施例中,所得的对历史用户留存率影响程度较高的用户画像标签为多项,这些画像标签并非为每一历史用户所具备,其可以是不同历史用户分别所具备的画像标签。在步骤130中,从关键指标中选取至少一项进行关键指标的分组。其中,由于根据上述步骤所得的关键指标为多项,可以从所得的关键指标中选取至少一项进行关键指标分组,以得到不同的关键指标组。举例来说,假设获得的关键指标包括关键指标A、关键指标B和关键指标C,那么,对关键指标进行分组所得的关键指标组可以包括:关键指标组A表示该关键指标组中仅包含关键指标A,下述关键指标B以及关键指标组C同理、关键指标组B、关键指标组C、关键指标组AB表示该关键指标组中包含有关键指标A和关键指标B,下述关键指标组AC以及关键指标组BC同理、关键指标组AC、关键指标组BC、关键指标组ABC表示该关键指标组中包含有关键指标A、关键指标B和关键指标C中的至少一种。在步骤150中,根据所选取的关键指标在指定历史时间段内对历史用户留存率的影响程度,获得所在关键指标分组对应的历史留存率分布。其中,所选取的关键指标为上述步骤130所进行关键指标分组中选取的至少一项关键指标,即每一关键指标组中所包含的关键指标。每一关键指标组在指定历史时间段内对历史用户留存率的影响程度所指的是,包含有该关键指标组中全部关键指标的历史用户所对应的历史用户留存率的大小。如前所述,由于每一历史用户对应的历史用户留存率可根据该历史用户的历史用户数据获取,因此,可分别获得包含有每一关键指标组中全部关键指标的历史用户所对应的历史用户留存率。一般来说,包含有相同关键指标的历史用户所对应的历史用户留存率往往各不相同。因此,在本实施例中,将包含有关键指标组中全部关键指标的历史用户所对应的历史用户留存率所在的分布区间作为关键指标组所对应的历史用户留存率分布。例如,假设存在历史用户1、历史用户2和历史用户3包含关键指标A和关键指标B,历史用户1对应的历史用户留存率为20%,历史用户2对应的历史用户留存率为25%,以及历史用户3对应的历史用户留存率为30%,那么,关键指标组AB所对应的历史用户留存率分布为20%至30%。因此,通过上述方法可依次获得每一关键指标组分别对应的历史用户留存率分布。在步骤170中,在业务所进行目标时间段的用户留存率预测中,根据所对应画像标签将所满足关键指标分组对应的历史留存率作为用户在目标时间段的用户留存率。其中,对所要进行用户留存率预测的互联网应用平台中的每一用户,其对应的用户画像标签仍可通过该用户的用户数据进行获取。画像标签满足关键指标分组表示为,当前进行用户留存率预测的用户所对应画像标签中包含有某一关键指标组中的全部关键指标。因此,在获取当前用户所对应的画像标签后,经由画像标签比对可获得当前用户所满足的关键指标组,将所满足的关键指标组对应的历史留存率分布作为预测的当前用户在目标时间段的用户留存率。需要说明的是,在本实施例中,当前用户或者历史用户所对应的画像标签中包含某一关键指标组中的全部关键指标应当理解为,在该用户的画像标签中,有且仅含有该关键指标组中的全部关键指标,而不应当含有除该关键指标组中全部关键指标外的其他关键指标。并且,目标时间段与历史时间段所对应的时间长度可以相同,也可以不同,本实施例对此不进行限定。因此,在本实施例中,对互联网应用平台中用户在目标时间段的用户留存率进行预测是依据影响历史用户留存率的关键指标得来的,这些关键指标能够从多方面反映历史用户的留存情况,通过将画像标签所满足关键指标分组所对应的历史留存率分布作为预测用户在目标时间段的用户留存率,使得本申请能够对用户留存率进行更加准确的预测。并且,本实施例直接通过将用户的画像标签与关键指标分组中的关键指标进行对比,将所满足的关键指标组对应的历史用户留存率分布作为预测的当前用户在目标时间段的用户留存率,采用本实施例提供的方法能够方便、快速地对用户留存率进行预测。如图3所示,在一示例性实施例中,为所在业务获取在指定历史时间段内影响历史用户留存率的关键指标可以具体包括以下步骤:在步骤111中,获取所在业务在指定历史时间段产生的历史用户数据。其中,所在业务在指定时间段内产生的历史用户数据可经由互联网应用平台所进行数据存储的平台数据库中获取。在一实施例中,平台数据库中所存储的用户数据是按照用户为单位进行存储的,可根据数据存储时间判断所存储的数据是否是在指定历史时间段内产生。因此,可从平台数据库中获取每一历史用户在指定历史时间段内产生的历史用户数据。在步骤113中,从历史用户数据中获取历史用户留存率满足预设留存阈值的历史用户。其中,预设留存阈值包括最大留存阈值和最小留存阈值,在获取每一历史用户对应的历史用户留存率之后,判断所获取的历史用户留存率与预设留存阈值之间的关系。如果获取的历史用户留存率大于最大留存阈值,以及获取的历史用户留存率小于最小留存阈值,则表示这些历史用户留存率满足预设留存阈值,将所对应的历史用户作为目标用户进行获取。需要说明是,本实施例所述的历史用户可以是以用户标识的形式存在于历史用户数据中的。在步骤115中,根据所述历史用户的画像标签获取影响历史用户留存率的关键指标。其中,可通过对所获取历史用户的历史用户数据进行数据清洗和结构化处理获得历史用户的用户画像数据,以从用户画像数据中提取对历史用户进行标注的画像标签。具体地,数据清洗是对所获取历史用户的历史用户数据进行审查和校验的过程,以得到准确的历史用户数据,例如历史用户的属性数据和历史用户的行为数据,然后通过对历史用户数据进行标签化,为每一条历史用户数据打上画像标签,以通过这些画像标签对每一历史用户进行标注。在一实施例中,影响历史用户留存率的关键指标可以是从历史用户的画像标签中选取与历史用户活跃度相关联的画像标签所获得的。其中,用户活跃度表示历史用户在互联网应用平台中的活跃程度,与历史用户活跃度相关联的画像标签可以是反映历史用户行为的画像标签。影响历史用户留存率的关键指标还可以是从历史用户的画像标签中选取与历史用户的参与率相关联的画像标签获得的,历史用户的参与率表示历史用户对互联网应用平台所进行优惠活动、或者其它业务的参与度,相关联的画像标签仍需要从反映历史用户行为的画像标签中获取。通过将所获取的若干画像标签作为备选指标,以从备选指标中进一步提取关键指标。需要说明的是,一项关键指标中可以只包含一种画像标签,或者可以包含多种画像标签的组合。例如,在一种寿险金融应用平台中,其中一项关键指标包括绑定在职代理人、开通旺财、绑定银行卡、上传步数四项画像标签,只有当历史用户的画像标签同时包括上述四项画像标签时,该历史用户才具备此项关键指标。在一实施例中,根据备选指标对历史用户留存率的影响程度,对备选指标进行排序,然后选取指定排名下的备选指标作为影响历史用户留存率的关键指标。具体地,首先,可根据备选指标所对应的历史参与人数对备选指标进行排序,获取第一指定排名对应的第一指标。其中,对每一备选指标来说,与其对应的历史参与人数为具备该项备选指标所对应画像标签的历史用户人数,如果具备该画像标签的历史用户数量较多,则可表示该项备选指标对历史用户留存率的影响程度较高。通过根据备选指标所对应的历史参与人数对备选指标进行排序,可获得备选指标按照历史用户留存率的影响程度所进行由高至低的排名。例如,假设所获取的备选指标为200个,在通过备选指标所对应的历史参与人数对备选指标进行排序之后,可选取排名为前30名的备选指标作为初步选择的备选指标,其中,所选取的排名为前30名的备选指标即为上述第一指标。在从备选指标中获取指定排名下的第一指标之后,按照第一指标对应的历史用户留存率对第一指标进行排序,以获取第二指定排名对应的第二指标。其中,由于参与每一项第一指标的历史用户的数量较多,可通过将这些历史用户所对应历史用户留存率的平均值作为与该项第一指标相对应的历史用户留存率;或者,也可以选取历史用户留存率分布最集中的分段作为该项第一指标相对应的历史用户留存率。根据每一项第一指标所对应历史用户的历史用户留存率对第一指标进行排序后,选取指定排名所对应的第一指标作为进一步选择的备选指标,这些进一步选择的备选指标即为上述第二指标。例如,可从上述30项第一指标中选取排名为前20名的第一指标作为上述第二指标。接下来,根据第二指标对应历史参与人数的差异值对第二指标进行排序,选取第三指定排名对应的第二指标作为关键指标。其中,第二指标对应历史参与人数的差异值为当前互联网应用平台中参与该第二指标的历史用户人数与未参与该第二指标的历史用户人数之间的差值。例如,某项第二指标对应的画像标签为“签到”,其中点击签到的历史用户人数有10000人,未点击签到的历史用户人数为4000人,那么,该项第二指标的差异值为6000。基于所述方法,可获取每一项第二指标所对应的差异值,并根据差异值对第二指标进行排序,并选取指定排名下的第二指标作为影响历史用户留存率的关键指标。例如,选取排名为前10名的第二指标作为关键指标。需要说明的是,上述所获取的第一指标、第二指标以及关键指标的数量均为预设值,可根据进行用户留存率预测的精确程度进行设定,所得关键指标的数量越多,越能够使得预测的用户留存率更准确。并且,上述与每一备选指标对应的历史参与人数、历史用户留存率和参与人数的差异值均为影响历史用户留存率的特征,可以根据此三种特征进行任意排序从备选指标中进行关键指标的获取,或者,根据此三种特征中的至少一种特征进行关键指标的获取,本实施例中并不表示对此进行了限定。因此,在本实施例中,通过获取多个影响历史用户留存率的特征,并根据这些特征分别对备选指标排序,以对备选指标进行进一步筛选,使得所获取的关键指标对历史用户留存率的影响程度较高,从而保证获取的历史用户留存率能够在尽可能大的程度上反映历史用户的留存情况。由此,通过本实施例所提供的方法,可使得用户留存率预测的准确度较高。如图4所示,在一示例性实施例中,根据所选取的关键指标在指定历史时间段内对历史用户留存率的影响程度,获得每一关键指标分组对应的历史留存率分布可以包括以下步骤:在步骤151中,获取每一历史用户在指定历史时间段对应的历史用户留存率以及每一历史用户对应的关键指标。其中,如前所述,每一历史用户在所述指定历史时间段对应的历史用户留存率可根据历史用户数据获得,并且,还可以从历史用户数据中获得每一历史用户的画像标签,将每一历史用户的画像标签与关键指标进行对比,则可获取该历史用户所具备的关键指标。在步骤153中,根据关键指标分组中的全部关键指标,获得满足所述全部关键指标所对应历史用户的历史用户留存率。其中,由于步骤151中获取到每一历史用户所具备的关键指标,只需判断历史用户所具备的关键指标满足哪一关键指标组,则该历史用户的历史用户留存率即为该项关键指标组所对应的历史用户留存率。对每一关键指标组来说,满足该关键指标组中全部关键指标的历史用户数量往往为多个,因此,需分别获取这些历史用户的历史用户留存率。在步骤155中,将满足全部关键指标所对应历史用户的最小历史用户留存率和最大历史用户留存率作为关键指标分组对应的历史用户留存率分布的起始和末尾,得到关键指标分组对应的历史留存率分布。其中,对每一关键指标组来说,在获得满足该关键指标组中全部关键指标的历史用户的历史用户留存率之后,将最小历史用户留存率与最大历史用户留存率所形成的分布区间作为关键指标组所对应的历史留存率分布。因此,在本实施例中,由于影响历史用户留存率的因素较为复杂,通过获取每一关键指标组所对应的历史留存率分布,能够更加准确地反映满足该关键指标组中全部关键指标的历史用户所对应的历史留存情况。在另一示例性实施例中,上述基于大数据分析的用户留存率预测方法还包括以下步骤:根据所在业务中用户在目标时间段的用户留存率,获取用户在目标时间段的留存等级。其中,留存等级和其相应的判断条件为预先设定的,例如,可设定用户留存率0-20%为低留存,用户留存率20%-40%为较低留存,用户留存率40%-60%为普通留存,用户留存率60%-80%为较高留存,用户留存率80%-100%为高留存。其中,上述用户留存率区间为预设的判断条件,与上述用户留存率分布相对应的留存程度为预设的留存等级。由于根据上述实施例预测所获得的用户留存率具体为一用户留存率分布,则根据所预测的用户留存率分布与预设的判断条件进行对比。其中,如果预测用户的用户留存率分布满足某一预设用户留存率区间,则该预设用户留存率区间所对应的预设留存程度即为预测用户在目标时间段的留存等级。例如,假设预测用户的用户留存率分布为5%-15%,则预设用户对应的留存等级为低留存。如果预测用户的用户留存率分布位于某两个连续的预设用户留存率区间之间,则获取预测用户的用户留存率分布中多数满足的其中一个预设用户留存率区间,并将所获取预设用户留存率区间对应的预设留存程度作为该用户在目标时间段的留存等级。例如,假设预测用户的用户留存率分布为25%-45%,则预测用户对应的留存等级为预设用户留存率区间20%-40%所对应的较低留存。如果预测用户的用户留存率分布之间的跨度超过至少两个连续的预设用户留存率区间,则获取对应历史用户数量最多的预设用户留存率区间为预测用户的用户留存率分布所满足的预设用户留存率区间。例如,预测用户的用户留存率分布为15%-65%,在进行该用户留存率分布预测时,有30个历史用户的历史用户留存率在20%-40%之间,有15个历史用户的历史用户留存率在40%-60%之间,则将预设用户留存率区间20%-40%对应的较低留存作为该预测用户所对应的留存等级。在获取每一预测用户所对应的留存等级后,互联网应用平台的拥有者可根据不同的留存等级采取不同的促活方式对预测用户进行促活。举例来说,可以针对低留存等级和较低留存等级的用户进行专项活动,例如指派特定的专项人员对每一用户进行电话访问或者推送调查文件,以充分了解每一用户的需求,从而为这些用户制定适合的专项活动,最大程度上增加这些用户的活跃度。同理,也可以针对其他留存等级的用户指定专项活动,以满足不同用户的需求,以对平台中的用户进行高效率地留存。在一示例性实施例中,为所在业务获取指定历史时间段内影响历史用户留存率的关键指标还包括以下步骤:检测业务平台在指定历史时间段内是否存在历史更新;如果存在,获取所述指定历史时间段在所述历史更新的时间之后影响所述历史用户留存率的关键指标;如果不存在,则获取所述指定历史时间段内影响所述历史用户留存率的关键指标。其中,由于互联网应用平台所进行更新的功能对用户留存率的影响往往是极大的,只有及时更新关键指标才能使得用户留存率得到准确地预测,此时影响历史用户留存率的关键指标往往包含有更新的功能参数。因此,在获取关键指标前,需检测互联网应用平台在指定历史时间段内是否存在历史更新。如果检测到该互联网应用平台存在历史更新的情况,则只获取指定历史时间段在该历史更新时间之后影响历史用户留存率的关键指标。如果没有检测到历史更新,则获取所述指定历史时间段内影响历史用户留存率的关键指标。关键指标仍按照上述实施例所述的方法进行获取,具体请参见步骤111至步骤115中所描述的内容。因此,在本实施例中,可根据互联网应用平台是否存在历史更新情况对关键指标进行更加准确地获取,进一步提高用户留存率预测的精准程度。如图5所示,在一示例性实施例中,本申请还提供一种基于大数据分析的用户留存率预测装置,该装置包括关键指标获取模块210、关键指标分组模块230、历史留存率分布获取模块250和用户留存率获取模块270。关键指标获取模块210用于为所在业务获取指定历史时间段内影响历史用户留存率的关键指标。关键指标分组模块230用于从关键指标中选取至少一项进行关键指标的分组。历史留存率分布获取模块250用于根据所选取的关键指标在指定历史时间段内对历史用户留存率的影响程度,获得所在关键指标分组对应的历史留存率分布。用户留存率获取模块270用于在业务所进行目标时间段的用户留存率预测中,根据所对应画像标签将所满足关键指标分组对应的历史留存率作为用户在目标时间段的用户留存率。在另一示例性实施例中,关键指标获取模块210可以具体包括历史用户数据获取单元、历史用户获取单元和第一关键指标获取单元。历史用户数据获取单元用于获取所在业务在指定历史时间段产生的历史用户数据。历史用户获取单元用于从历史用户数据中获取历史用户留存率满足预设留存阈值的历史用户。第一关键指标获取单元用于根据历史用户的画像标签获取影响历史用户留存率的关键指标。在另一示例性实施例中,第一关键指标获取单元可以具体包括备选指标获取子单元和关键指标获取子单元。备选指标获取子单元用于从历史用户的画像标签中选取若干与历史用户活跃度相关联的画像标签作为备选指标。关键指标获取子单元用于根据备选指标对历史用户留存率的影响程度,对备选指标进行排序,选取指定排名下的备选指标作为影响所述历史留存率的关键指标。在另一示例性实施例中,历史留存率分布获取模块250可以具体包括第二关键指标获取单元、历史用户留存率获取单元和历史留存率分布获取单元。第二关键指标获取单元用于获取每一历史用户在指定历史时间段对应的历史用户留存率以及每一历史用户对应的关键指标。历史用户留存率获取单元用于根据关键指标分组中的全部关键指标,获得满足全部关键指标所对应历史用户的历史用户留存率。历史留存率分布获取单元用于将满足全部关键指标所对应历史用户的最小历史用户留存率和最大历史用户留存率作为关键指标分组对应的历史用户留存率分布的起始和末尾,得到关键指标分组对应的历史留存率分布。在另一示例性实施例中,关键指标获取模块210还可以具体包括历史更新检测单元和第三关键指标获取单元。历史更新检测单元用于检测业务平台在指定历史时间段内是否存在历史更新。如果历史更新检测单元检测到存在历史更新,第三关键指标获取单元则获取指定历史时间段在历史更新的时间之后影响历史用户留存率的关键指标。如果历史更新检测单元检测到存在历史更新,第三关键指标获取单元则获取指定历史时间段内影响历史用户留存率的关键指标。在另一示例性实施例中,基于大数据分析的用户留存率预测装置还包括留存等级获取模块,留存等级获取模块用于根据所在业务中用户在目标时间段的用户留存率,获取用户在目标时间段的留存等级。需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。在一示例性实施例中,本申请还提供一种电子设备,该电子设备包括:处理器;存储器,该存储器上存储有计算机可读指令,该计算机可读指令被处理器执行时,实现如前所示的基于大数据分析的用户留存率预测方法。在一示例性实施例中,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如前所示的基于大数据分析的用户留存率预测方法。应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

权利要求:1.一种基于大数据分析的用户留存率预测方法,其特征在于,包括:为所在业务获取指定历史时间段内影响历史用户留存率的关键指标;从所述关键指标中选取至少一项进行所述关键指标的分组;根据所选取的关键指标在所述指定历史时间段内对所述历史用户留存率的影响程度,获得所在关键指标分组对应的历史留存率分布;在业务所进行目标时间段的用户留存率预测中,根据所对应画像标签将所满足关键指标分组对应的历史留存率分布作为用户在所述目标时间段的用户留存率。2.根据权利要求1所述的方法,其特征在于,所述为所在业务获取在指定历史时间段内影响历史用户留存率的关键指标,包括:获取所在业务在指定历史时间段产生的历史用户数据;从所述历史用户数据中获取历史用户留存率满足预设留存阈值的历史用户;根据所述历史用户的画像标签获取影响所述历史用户留存率的关键指标。3.根据权利要求2所述的方法,其特征在于,所述根据所述历史用户的画像标签获取影响所述历史用户留存率的关键指标,包括:从所述历史用户的画像标签中选取若干与历史用户活跃度相关联的画像标签作为备选指标;根据所述备选指标对所述历史用户留存率的影响程度,对所述备选指标进行排序,选取指定排名下的所述备选指标作为影响所述历史留存率的关键指标。4.根据权利要求3所述的方法,其特征在于,所述根据所述备选指标对所述历史用户留存率的影响程度,对所述备选指标进行排序,选取指定排名下的所述备选指标作为影响所述历史留存率的关键指标,包括:根据所述备选指标所对应的历史参与人数对所述备选指标进行排序,获取第一指定排名对应的第一指标;按照所述第一指标对应的历史用户留存率对所述第一指标进行排序,获取第二指定排名对应的第二指标;根据所述第二指标对应历史参与人数的差异值对所述第二指标进行排序,选取第三指定排名对应的所述第二指标作为所述关键指标。5.根据权利要求1所述的方法,其特征在于,所述根据所选取的关键指标在所述指定历史时间段内对所述历史用户留存率的影响程度,获得每一关键指标分组对应的历史留存率分布,包括:获取每一历史用户在所述指定历史时间段对应的历史用户留存率以及每一所述历史用户对应的关键指标;根据所述关键指标分组中的全部关键指标,获得满足所述全部关键指标所对应历史用户的历史用户留存率;将满足所述全部关键指标所对应历史用户的最小历史用户留存率和最大历史用户留存率作为所述关键指标分组对应的历史用户留存率分布的起始和末尾,得到所述关键指标分组对应的历史留存率分布。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所在业务中用户在目标时间段的用户留存率,获取所述用户在所述目标时间段的留存等级。7.根据权利要求1所述的方法,其特征在于,所述为所在业务获取指定历史时间段内影响历史用户留存率的关键指标,包括:检测业务平台在所述指定历史时间段内是否存在历史更新;如果存在,获取所述指定历史时间段在所述历史更新的时间之后影响所述历史用户留存率的关键指标;如果不存在,则获取所述指定历史时间段内影响所述历史用户留存率的关键指标。8.一种基于大数据分析的用户留存率预测装置,其特征在于,所述装置包括:关键指标获取模块,用于为所在业务获取指定历史时间段内影响历史用户留存率的关键指标;关键指标分组模块,用于从所述关键指标中选取至少一项进行所述关键指标的分组;历史留存率分布获取模块,用于根据所选取的关键指标在所述指定历史时间段内对所述历史用户留存率的影响程度,获得所在关键指标分组对应的历史留存率分布;用户留存率获取模块,用于在业务所进行目标时间段的用户留存率预测中,根据所对应画像标签将所满足关键指标分组对应的历史留存率作为用户在所述目标时间段的用户留存率。9.一种电子设备,其特征在于,所述设备包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1至7任一项所述的基于大数据分析的用户留存率预测方法。10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1至7任一项所述的基于大数据分析的用户留存率预测方法。

百度查询: 中国平安人寿保险股份有限公司 基于大数据分析的用户留存率预测方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。