【发明授权】一种目标客户分类系统_张莹_201710217622.3 

申请/专利权人:张莹

申请日:2017-04-05

发明/设计人:苏华巍;张蓓

公开(公告)日:2021-02-19

代理机构:北京金言诚信知识产权代理有限公司

公开(公告)号:CN106980769B

代理人:刘宝荣

主分类号:G06Q30/02(20120101)

地址:100061 北京市崇文区龙潭北里一条2楼3单元8号

分类号:G06Q30/02(20120101);G06F16/2457(20190101)

优先权:

专利状态码:有效-授权

法律状态:2021.02.19#授权;2017.08.18#实质审查的生效;2017.07.25#公开

摘要:一种目标客户分类系统,包括:用户基本信息采集单元,通过人机交互界面采集用户基本信息;用户基本信息分析单元,对用户基本信息采集单元采集到的用户基本信息进行分析以确定该用户的初级类别;次级用户信息采集单元生成单元,用于根据所述用户的初级类别,生成用于进一步采集用户信息的包括次级用户信息选项的人机交互界面;次级用户信息采集单元,将所述人机交互界面提供给用户;计算单元,利用所述次级用户信息采集单元采集到的用户特征数据和数据库单元存储的特征与事件之间的相关性数据计算所述用户特征与事件之间的综合关联值;用户分类单元,对所述计算单元计算的所述相关值对用户进行分类;结果输出单元,输出分类结果。

主权项:1.一种用于中医体质甄别或健康评估的目标客户分类系统,包括:用户基本信息采集单元,通过人机交互界面采集由用户输入的用户基本信息;用户基本信息分析单元,对用户基本信息采集单元采集到的用户基本信息进行分析以确定该用户的初级类别;次级用户信息采集单元生成单元,用于根据所述用户的初级类别,生成用于进一步采集用户信息的包括次级用户信息选项的人机交互界面;次级用户信息采集单元,将所述人机交互界面提供给用户;计算单元,利用所述次级用户信息采集单元采集到的用户特征数据和数据库单元存储的特征与事件之间的相关性数据计算所述用户特征与事件之间的综合关联值;用户分类单元,对所述计算单元计算的所述综合关联值对用户进行分类;结果输出单元,输出分类结果;所述计算单元为分级嵌套计算单元,包括第一级分级嵌套计算单元到第N级分级嵌套计算单元,N为大于等于2的自然数;所述分级嵌套计算单元的第一级分级计算嵌套计算单元采用公式 计算综合关联值Fj;其中Fj为事件j与多个或全部特征1,2,3…i之间的综合关联值,recti为矩形函数,i为真时recti=1,i为假时recti=0,对应的物理含义是:事件j的特征i发生或采集到时综合关联值Fj的分子部分考虑相关性数值,而对于未发生或未采集到的特征i综合关联值Fj的分子部分不予考虑;WIj为数据库中存储的外部特征I与事件j之间的相关性数值,Ki为特征权重值,该权重值能够根据需要设定;第二级分级嵌套计算单元采用公式 计算综合关联值Fb;Fb为事件b与多个或全部特征1,2,3…a之间的综合关联值,recta为矩形函数,a为真时recta=1,a为假时recta=0;对应的物理含义是:事件b的特征a发生或采集到时综合关联值Fb的分子部分考虑相关性数值,而对于未发生或未采集到的特征a综合关联值Fb的分子部分不予考虑相关性数值,VIb为数据库中存储的外部特征I与事件b之间的相关性数值。

全文数据:一种目标客户分类系统技术领域[0001]本发明涉及数据计算领域,具体涉及一种对目标客户的分类系统,其可以用于用户画像、人群区分、精准商业投放、人体中医体质甄别、健康评估、自助服务等技术领域。背景技术[0002]新商业时代,精准是商业核心,是产品和服务能否有机会与用户连接的先决条件,是商业存亡的关键。谷歌、阿里巴巴、Uber为什么值钱?就是因为它们抓住了“精准”这个未来商业的本质。[0003]在今天“精准”之所以成为可能,首先源于大数据的支撑,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”,因此在数据就是生产力的今天,对大数据的分析、计算和处理能力就显的尤为重要。[0004]“精准”商业的基本前提是利用大数据对目标客户进行“精准”分类区分,然后进行有针对性的商业行为。发明内容[0005]本发明的目的在于提供一种高效、精确的目标客户分类系统,其能够用于用户画像、人群区分、精准商业投放、人体中医体质甄别、健康评估等技术领域。[0006]为达此目的,本发明采用以下技术方案:[0007]—种目标客户分类系统,包括:用户基本信息采集单元,通过人机交互界面采集用户基本信息;用户基本信息分析单元,对用户基本信息采集单元采集到的用户基本信息进行分析以确定该用户的初级类别;次级用户信息采集单元生成单元,用于根据所述用户的初级类别,生成用于进一步采集用户信息的包括次级用户信息选项的人机交互界面;次级用户信息采集单元,将所述人机交互界面提供给用户;计算单元,利用所述次级用户信息采集单元采集到的用户特征数据和数据库单元存储的特征与事件之间的相关性数据计算所述用户特征与事件之间的综合关联值;用户分类单元,对所述计算单元计算的所述相关值对用户进行分类;结果输出单元,输出分类结果。[0008]作为本发明的优选实施例,所述目标客户分类系统包括数据库单元,用于存储特征与事件之间的相关性数据;所述特征与事件之间的相关性数据可以是基于历史经验积累的数据,也可以是利用相关性分析获得的相关性数据,还可以是采用人工智能机器自学习获取的相关性数据。[0009]作为本发明的优选实施例,所述计算单元为专家系统。[0010]作为本发明的优选实施例,所述计算单元通过如下方式计算所述外部特征与事件之间的综合关联值:[0012]其中Fj为事件j与多个或全部特征1,2,3···ί之间的综合关联值,recti为矩形函数,i为真时rect⑴=l,i为假时rect⑴=0,对应的物理含义是:事件j的特征i发生或采集到时综合关联值Fj的分子部分考虑相关性数值W^,而对于未发生或未采集到的特征i综合关联值Fj的分子部分不予考虑;Wij为数据库中存储的外部特征i与事件j之间的相关性数值。[0013]作为本发明的优选实施例,计算单元通过如下方式计算所述外部特征与事件之间的综合关联值:[0015]其中Fj为事件j与多个或全部特征1,2,3···ί之间的综合关联值,recti为矩形函数,i为真时rect⑴=l,i为假时rect⑴=0,对应的物理含义是:事件j的特征i发生或采集到时综合关联值Fj的分子部分考虑相关性数值W^,而对于未发生或未采集到的特征i综合关联值Fj的分子部分不予考虑A1为特征权重值,该权重值可以根据需要而设定;Wlj为数据库中存储的外部特征i与事件j之间的相关性数值。[0016]作为本发明的优选实施例,所述计算单元为分级嵌套计算单元,包括第一级分级嵌套计算单元到第N级分级嵌套计算单元,N为大于等于2的自然数。[0017]作为本发明的优选实施例,所述分级嵌套计算单元的第一分级计算嵌套计算单元采用公5卜算综合关联值第二分级嵌套计算单元采用公式计算综合关联值Fb;Fb为事件b与多个或全部特征1,2,3-_a之间的综合关联值,recta为矩形函数,a为真时recta=l,a为假时recta=0;对应的物理含义是:事件b的特征a发生或采集到时综合关联值Fb的分子部分考虑相关性数值Vab,而对于未发生或未采集到的特征a综合关联值Fb的分子部分不予考虑相关性数值Vab;Ka为特征权重值,该权重值可以根据需要而设定。[0018]作为本发明的优选实施例,所述数据库单元中存储的特征与事件之间的相关性数据是根据已有的经验数据构建,上述相关性数据不必然是数字,其包括但不限于是比值、百分数、概率。[0019]作为本发明的优选实施例,所述一种目标客户分类系统为中医体质甄别系统,其可以根据用户输入的系统问询信息推理计算出受试者所属的中医体质。[0020]作为本发明的优选实施例,所述用户基本信息包括:性别、年龄、身高、体重、家族病史等。[0021]作为本发明的优选实施例,所述次级用户信息包括:用户自身感受、生活习惯、身体症状、运动情况等。[0022]作为本发明的优选实施例,所述结果输出单元包括:显示器、打印机、投影仪、无线发射器等。附图说明[0023]图1是本发明的目标客户分类系统的示意图;[0024]图2是专家系统结构示意图。[0025]1用户基本信息采集单元;[0026]2用户基本信息分析单元;[0027]3次级用户信息采集单元生成单元;[0028]4次级用户信息采集单元;[0029]5计算单元;[0030]6用户分类单元;[0031]7结果输出单兀;具体实施方式[0032]下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。[0033]体现本发明特征与优点的典型实施例将在以下的说明中详细叙述。应理解的是本发明能够在不同的实施例上具有各种的变化,其皆不脱离本发明的范围,且其中的说明及图示在本质上是当作说明之用,而非用以限制本发明。[0034]本发明所公开的对目标客户的分类系统,其可以用于用户画像、人群区分、精准商业投放、人体中医体质甄别、健康评估、自助服务等技术领域。[0035]一种目标客户分类系统,包括:用户基本信息采集单元,通过人机交互界面采集用户基本信息;所述用户基本信息采集单元所采集的用户基本信息可以根据需要设定,例如在所述系统用于中医体质甄别时,用户基本信息可以包括:性别、年龄、身高、体重、家族既往病史等,所述用户基本信息采集单元优先地,包括有非法输入信息识别单元,当用户输入非法用户信息时,系统自动提醒用户重新输入,例如输入年龄小于0,大于100时,系统将自动将其识别为非法用户信息,对输入的信息不予识别,并提醒用户重新输入。[0036]用户基本信息分析单元,对用户基本信息采集单元采集到的用户基本信息进行分析以确定该用户的初级类别;例如,所述系统用于中医体质甄别时,根据用户输入的性别、年龄、身高、体重、家族既往病史等基本信息初步判断该用户大致属于那类人群。[0037]次级用户信息采集单元生成单元,用于根据所述用户的初级类别,生成用于进一步采集用户信息的包括次级用户信息选项的人机交互界面;例如,根据用户基本信息分析单元分析得出的目标客户大致属于的人群种类,获知该类人群最容易出现的亚健康状态,例如判定该类人群较为容易肥胖、便秘等,则生成有关肥胖或便秘的问询信息列表,为说明问题方便,以便秘为例做示例性说明:[0038]在中医领域气虚体质人群便秘通常表现为大便不干不硬,虽有便意,但排便困难,用力努挣则汗出气短,便后乏力,面白神疲,肢倦懒言,舌淡苔白,脉弱;阴虚体质人群便秘通常表现为大便干结,如硬球状,形体消瘦,头晕耳鸣,两颧红赤,心烦少眠,潮热盗汗,腰膝酸软,舌红少苔,脉细数;阳虚质体质人群便秘通常表现为大便干或不干,排出困难,小便清长,面色咣白,四肢不温,腹中冷痛,或腰膝酸冷,舌淡苔白,脉沉迟;气郁体质人群便秘通常表现为大便干结,或不甚干结,欲便不得出,或便而不爽,肠鸣矢气,腹中胀痛,嗳气频作,纳食减少,胸胁痞满,舌苔薄腻,脉弦;湿热体质人群便秘通常表现为大便粘滞,欲便不得出,或便而不爽,口苦或口干,口中有异味,胃胀,呃逆,反酸,小便短赤,色黄,舌红苔黄腻。因此,可以依据传统医学经验生成如下问询信息列表:[0039]1.大便的状态?[0040]A大便不干不硬B大便干结C大便如硬球状D大便粘稠[0041]E大便先干后稀[0042]2.排出的感觉?[0043]A虽有便意,但排便困难,排后感觉舒服[0044]B虽有便意,但排便困难,大便排不出[0045]C想要排便排不出,或者排便不爽快[0046]D肛门有沉重下坠的感觉[0047]3.其他伴随症状?[0048]A乏力,面色淡白,疲倦,不想说话,饭量减少[0049]B形体消瘦,两颧红赤,或夜间汗出,手足心热[0050]C面色咣白,手足发凉,不喜欢冰冷的食物[0051]D肠鸣排气,或腹中胀痛,频繁打嗝,饭量减少[0052]E口苦或口干,口中有异味,或胃部胀满,打嗝,反酸。[0053]4.小便量色?[0054]A尿量增多,小便清长B小便短少,色黄C小便正常[0055]5·舌?[0056]A舌淡,苔白[0057]B舌淡胖,齿痕,苔薄白或白腻[0058]C舌红,少苔D舌淡红,苔薄白E舌红,苔黄腻[0059]次级用户信息采集单元,将所述人机交互界面提供给用户;上述的实施例中就是将上述问询信息生成人机交互界面,并通过显示器、投影仪、音频输入输出装置等。[0060]计算单元,利用所述次级用户信息采集单元采集到的用户特征数据和数据库单元存储的特征与事件之间的相关性数据计算所述用户特征与事件之间的综合关联值。[0061]所述计算单元可以为专家系统。[0062]专家系统的结构如图2所示。[0063]专家系统一般由知识库及其管理系统、推理机、综合数据库、知识获取机制、解释机构和人机接口六部分组成。[0064]知识库及其管理系统[0065]知识库是以一致的形式存储知识的机构,用于存储某领域专家的经验性知识、原理性知识、相关的事实、可行操作与规则等。解决知识获取和知识表示问题是建立知识库的关键问题。[0066]知识获取机制[0067]知识获取机制的建立,实质上是设计一组程序,把知识送入到知识库,负责维护知识的正确性、一致性和完整性。知识获取是专家系统知识库是否优越的关键,我们试图建立自动知识获取机制,实现专家系统的自动学习功能,不断地扩充和修改知识库中的内容。[0068]综合数据库[0069]综合数据库又称全局数据库或“黑板”等,它用于存储领域或问题的初始数据信息)、推理过程中得到的中间结果或状态以及系统的目标结果,包含了被处理对象的一些问题描述、假设条件、当前事实等。[0070]推理机[0071]推理机是专家系统中实现基于知识推理的部件,是基于知识的推理在计算机中的实现,是专家系统的核心部分。推理机用于记忆所采用的规则和控制策略的程序,完成依据一定的知识规则从已有的事实推出结论的近似专家的思维过程,保证整个专家系统能够以逻辑方式协调地工作。[0072]解释机构[0073]解释机构能够向用户解释专家系统的行为,包括解释推理结论的正确性以及系统输出其它候选解的原因。这是专家系统区别于其它软件系统的主要特征之一,解释机构实际上也是一组计算机程序,通常采用预置文本法和路径跟踪法。当用户有询问需求时,解释机构可以跟踪和记录推理过程,把解答通过人机交互接口输出给用户。[0074]人机接口[0075]接口又称界面,是用户与专家系统之间的连接桥梁,它能够使系统与用户进行对话,使用户能够输入必要的数据、提出问题和了解推理过程及推理结果。专家系统则通过接口,要求用户回答提问,并回答用户提出的问题,进行必要的解释。[0076]专家系统的特点[0077]具有领域专家级的专门知识[0078]专家系统的智能化主要体现为能够在特定的领域内模仿人类专家思维来求解复杂问题,这就要求必须具有专家级的知识,知识越丰富,解决问题的能力就越强。知识的来源可以是专家或技术人员长期积累的经验,大量的实际试验数据与事例,也可以是书本、资料,或者是基本原理和规则。知识的数量和质量直接影响专家系统的性能。[0079]符号处理和启发式推理[0080]专家系统的知识库存放着符号表示的专家知识,能运用知识与经验进行推理、判断和决策。世界上的大部分知识都是非数学性的,几乎全靠符号推理,而不是数值计算,只有一小部分人类活动是以数学公式为核心的。专家系统擅长符号处理和逻辑推理,特别适合于解决自动计算、问诊和启发式推理等基于规则的问题。它不仅能利用定义严格的逻辑性知识,而且还能利用经验知识和启发性知识来完成工程设计任务。[0081]具有灵活性[0082]专家系统一般都采用知识库和推理机制分离的构造原理,只要抽去知识库中的知识,它就是一个专家系统外壳。如果要建立另外一个功能类似的专家系统时,只要把相应的知识装入到该外壳的知识库中就可以了。推理机的性能与构造与知识的内容无关,有利于专家系统能不断地增长知识,修改原有知识,不断地更新和丰富知识规则,提高解决问题的能力和灵活性。由于这一特点,使得专家系统具有十分广泛的应用领域。[0083]具有获取知识的能力[0084]专家系统的基础是知识,为了得到知识就必须具有获取知识的能力。专家知识的获取通过人工获取方式、半自动获取方式和自动获取方式。知识的获取目的是为修改和扩充知识提供了有效的手段。[0085]具有透明性[0086]所谓的透明性是指系统自身及其行为能被用户所理解。专家知识多是个人经验的积累和实践中技巧、规律的总结,这类启发性的知识不为大众所熟知,也没有正确性的保障,因此专家系统必须具有解释机制,使人们在应用它的时候,不仅得到了正确的答案,而且还可以知道得到答案的依据,增加对专家系统的信任程度。[0087]具有交互性[0088]专家系统一般都是交互式的,一方面与专家对话获取知识,另一方面与用户对话以索取求解问题时所需的已知事实以及回答用户的询问。这种交互式方式体现在友好的界面、功能智能化和操作自然化等方面。[0089]具有一定的复杂性和难度[0090]专家系统拥有知识,可以运用知识进行推理,模拟人类的思维过程。但是,人类的知识是丰富多彩的,思维方式也是多种多样的。因此,要真正实现对人类思维的模拟,是一件非常困难的工作,并有赖于其他许多学科的共同发展。[0091]所述计算单元还可以通过如下方式实现:[0092]为了研究问题方便,我们建立下列数学模型,对上述此类问题进行普遍性研究。假设特征1,2,3···;ί与事件1,2,3···j之间的相关性用Wij表不,即:[0093][0094]其中特征1,2,3···ί与事件1,2,3···」之间的相关性Wlj可以根据已有的经验数据构建,例如前面列举的便秘的例子,[0095]按照中医理论人体处于阴虚质、阳虚质、痰湿质、气虚质、瘀血质、气郁质和和平质中的其中一种。按照传统经验便秘与体质的关联性如下:[0096]A腹部胀满,进食减少,或者进食后腹胀更加明显[0097]脾气虚5肺气虚0心气虚0肾气虚0[0098]B容易感冒,或咳嗽,无力,怕风。[0099]脾气虚1肺气虚5心气虚1肾气虚0[0100]C心慌,活动后心慌更加明显。[0101]脾气虚0肺气虚2心气虚5肾气虚0[0102]D小便次数多,或尿后淋漓不尽,或腰膝酸软,夜尿多。[0103]脾气虚1肺气虚1心气虚0肾气虚5[0104]这里需要说明的是中医体质不限于前面提到的9种体质,其还可以进一步细分如下:[0105]对于阴虚体质质又可能是心阴虚态、肺阴虚态、肝阴虚态、胃阴虚态、心肾阴虚态、肺肾阴虚态或肝肾阴虚态;对于阳虚体质又可能是心阳虚态、脾阳虚态、肾阳虚态、心肾阳虚态或脾肾阳虚态;对于痰湿体质又可能是肺痰湿态或脾痰湿态;对于湿热体质又可能是肝胆湿热态、脾胃是湿热态、大肠湿热态或膀胱湿热态;对于气虚体质又可能是心气虚态、肺气虚态、脾气虚态、肾气虚态、心肺气虚态、肺脾气虚态、脾肾气虚态、心肾气虚态或心脾气虚态;淤血体质又可能是心淤血态或肝淤血态;气郁体质又可能是肝气郁态或胆气郁态,[0106]其中数值0、1、2、3、4和5就是相关性数值Wlj,这里需要说明的是上述相关性数值Wlj不必然是数字,其可以是比值、百分数、概率等一切便于计算的数值。[0107]特征1,2,3…i与事件1,2,3…j之间的相关性Wij也可以通过对已有的特征和事件的相关样本库利用回归方程拟合求得,具体的回归方程可以利用任何现有技术中的常规计算方式求得,甚至在一些常用的数学分析软件,例如=MATLAB等中均可以实现上述过程。这里需要注意的是该分析方法适用于特征1,2,3···ί与事件1,2,3···」之间存在因果关系的样本数据。[0108]特征1,2,3…i与事件1,2,3…j之间的相关性Wij也可以通过对已有的特征和事件的相关样本库利用相关性分析的方式求得,上述相关性分析在现有技术中有成熟的技术,出于节约篇幅考虑这里不再重复。[0109]接下来的问题是如何综合考虑特征1,2,3···ί中的多个或全部与某一事件之间的关联性:[0111]Fj为事件j与多个或全部特征1,2,3···ί之间的综合关联值,recti为矩形函数,i为真时recti=1,i为假时rect⑴=0。对应的物理含义是:事件j的特征i发生或采集到时综合关联值Fj的分子部分考虑相关性数值Wlj,而对于未发生或未采集到的特征i综合关联值Fj的分子部分不予考虑。从上述公式中不难看出,当事件j的全部特征都发生时综合关联值Fj将为1,则可以判定事件j发生的概率为100%,S卩,必然发生;而只有部分特征发生时综合关联值Fj为小于1的某个数值,即其代表事件j发生的概率大小,或者说是事件j与所示部分特征之间的关联性大小。[0112]在另外一些实施例中对上述公式可以人为修正,还以中医体质甄别为例,例如:根据专家经验当某一个或某几个症状发生时就可以基本判断该病人的病症,而不需要考虑该病症发生全部症状。对于诸如此类情况,事件j与多个或全部特征1,2,3···ί之间的综合关联值Fj可以采用下述方式获得:[0114]Fj为事件j与多个或全部特征1,2,3···ί之间的综合关联值,recti为矩形函数,i为真时recti=1,i为假时rect⑴=0。对应的物理含义是:事件j的特征i发生或采集到时综合关联值Fj的分子部分考虑相关性数值Wlj,而对于未发生或未采集到的特征i综合关联值Fj的分子部分不予考虑A1为特征权重值,该权重值可以根据需要而设定,例如在前述中医体质甄别的应用实例中特征权重值K1可以根据专家经验而设定。[0115]采用上述方式对所有或多数事件与已经获知的特定的多个或全部特征1,2,3···ί之间的综合关联值F进行计算,并对所示综合关联值F进行排序,则F值最大者表示上述多个或全部特征与该事件的关联性最高,将该计算方式应用于中医体质的甄别实例中则表示属于该种类型的体质的可能性最大。利用上述计算方式也可以对特定的数据或事件进行分类或预测,在保险领域则表现为某种风险度的评估。[0116]需要进一步说明的是:事物和特征之间的关联和联系往往是极为复杂的,一次性计算往往意味着巨大的工作量,需要消耗巨大的计算资源,因此可以采用分级分层计算,通过计算单元的分层嵌套,一方面可以减少信息采集的数量,二是通过层级的划分,可以使复杂的问题简单化,计算也变的更为简单化。[0117]继续以中医体质的甄别为例,进一步进行示例性说明:假如利用前述计算方式经过特征采集初步确定某人属于气虚体质便秘时,为了进一步研究其属于具体属于气虚体质中的心气虚态、肺气虚态、脾气虚态、肾气虚态、心肺气虚态、肺脾气虚态、脾肾气虚态、心肾气虚态或心脾气虚态等10种状态中的哪一种状态,可以对特征数据进行进一步的采集,例如:[0118]A腹部胀满,进食减少,或者进食后腹胀更加明显[0119]脾气虚5肺气虚0心气虚0肾气虚0[0120]B容易感冒,或咳嗽,无力,怕风。[0121]脾气虚1肺气虚5心气虚1肾气虚0[0122]C心慌,活动后心慌更加明显。[0123]脾气虚0肺气虚2心气虚5肾气虚0[0124]D小便次数多,或尿后淋漓不尽,或腰膝酸软,夜尿多。[0125]脾气虚1肺气虚1心气虚0肾气虚5[0126]基于采集到的上述特征数据,可以利用与前述的计算方式相类似的计算方式计算相应的综合关联值,对计算结果进行排序比较,从而可以获得受试者具体属于气虚体质中的具体哪一种状态。具体的计算方式如下:[0127]建立下列数学模型。假设特征l,2,3-.a与事件1,2,3··+之间的相关性用Vab表示,即:[0128][0129]其中特征l,2,3-_a与事件l,2,3-_b之间的相关性Vab可以根据已有的经验数据构建,例如前面列举的便秘的例子,其中数值〇、1、2、3、4和5就是相关性数值¥^,这里需要说明的是上述相关性数值Vab不必然是数字,其可以是比值、百分数、概率等一切便于计算的数值。[0130]特征1,2,3…a与事件1,2,3…b之间的相关性Vab也可以通过对已有的特征和事件的相关样本库利用回归方程拟合求得,具体的回归方程可以利用任何现有技术中的常规计算方式求得,甚至在一些常用的数学分析软件,例如=MATLAB等中均可以实现上述过程。这里需要注意的是该分析方法适用于特征l,2,3-_a与事件l,2,3-_b之间存在因果关系的样本数据。[0131]特征l,2,3-_a与事件l,2,3-_b之间的相关性Vab也可以通过对已有的特征和事件的相关样本库利用相关性分析的方式求得,上述相关性分析在现有技术中有成熟的技术,出于节约篇幅考虑这里不再重复。[0132]接下来的问题是如何综合考虑特征l,2,3-_a中的多个或全部与某一事件之间的关联性:[0134]Fb为事件b与多个或全部特征1,2,3···之间的综合关联值,recta为矩形函数,a为真时recta=I,a为假时recta=0。对应的物理含义是:事件b的特征a发生或采集到时综合关联值Fb的分子部分考虑相关性数值Vab,而对于未发生或未采集到的特征a综合关联值Fb的分子部分不予考虑。从上述公式中不难看出,当事件b的全部特征都发生时综合关联值Fb将为1,则可以判定事件b发生的概率为100%,S卩,必然发生。而只有部分特征发生时综合关联值Fb为小于1的某个数值,即其代表事件b发生的概率大小,或者说是事件b与所示部分特征之间的关联性大小。[0135]在另外一些实施例中对上述公式可以人为修正,还以中医体质甄别为例,例如:根据专家经验当某一个或某几个症状发生时就可以基本判断该病人的病症,而不需要考虑该病症发生全部症状。对于诸如此类情况,事件b与多个或全部特征1,2,3···之间的综合关联值Fb可以采用下述方式获得:[0137]Fb为事件b与多个或全部特征1,2,3···之间的综合关联值,recta为矩形函数,a为真时recta=I,a为假时recta=0。对应的物理含义是:事件b的特征a发生或采集到时综合关联值Fb的分子部分考虑相关性数值Vab,而对于未发生或未采集到的特征a综合关联值Fb的分子部分不予考虑相关性数值Vab;Ka为特征权重值,该权重值可以根据需要而设定,例如在前述中医体质甄别的应用实例中特征权重值K1可以根据专家经验而设定。[0138]采用上述方式对所有或多数事件与已经获知的特定的多个或全部特征1,2,3···ί之间的综合关联值F进行计算,并对所示综合关联值F进行排序,则F值最大者表示上述多个或全部特征与该事件的关联性最高,将该计算方式应用于中医体质的甄别实例中则表示属于该种类型的体质的可能性最大。利用上述计算方式也可以对特定的数据或事件进行分类或预测,在保险领域则表现为某种风险度的评估;在消费领域将表现为对不同目标客户群体的分类。[0139]这里需要注意的是:上面所说的计算单元分层嵌套计算不限定于是两层,其具体的分层层级数量可以根据待计算的数据量大小、计算精度的要求而设计。分层计算时,不同层级的计算方式不必然要求相同,可以根据不同层级对数据的计算要求进行设计。[0Μ0]还以前面的中医体质甄别为例,在第一层级计算时,即粗略计算受试者属于哪一种中医体质时,为了在减少计算量,降低计算资源消耗量,提高运算速率可以采用参考专家经验的计算方式,即综合关联值采用公J行计算,而对于第二层级,即在已知受试者大致属于哪种体质后,在确定具体的身体状态时,可以采用全面计算的方式,即综合关联值采用公式往行计算,这样做的好处是计算结果相对客观,不受个人经验的影响,有利于提高计算精度。这里再次需要强调的是上述计算方式不得理解为对本发明的限制,其仅是示例性说明。[0141]用户分类单元,对所述计算单元计算的所述相关值对用户进行分类;所述分类可以是依据相关值大小的顺序排序,也可以是依据设定的特定阈值的阶段性分类,也可以是以其它任何标准的分类。[0142]结果输出单元,用于输出最终的计算结果,输出设备可以是显示器、打印机、投影仪、无线发射器等。[0143]所述目标客户分类系统还进一步可以包括数据库单元,用于存储特征与事件之间的相关性数据;所述特征与事件之间的相关性数据可以是基于历史经验积累的数据,也可以是利用相关性分析获得的相关性数据,还可以是采用人工智能机器自学习获取的相关性数据。当然所述数据库单元可以不包括在目标客户分类系统中,可以通过目标可以系统远程访问所述数据库单元的方式获取相关数据。[0144]所述计算单元为分级嵌套计算单元,包括第一级分级嵌套计算单元到第N级分级嵌套计算单元,N为大于等于2的自然数。[0145]所述分级嵌套计算单元的第一分级计算嵌套计算单元采用公式计算综合关联值K1为特征权重值,该权重值可以根据需要而设定。[0146]第二分级嵌套计算单元采用公::十算综合关联值Fb;Fb为事件b与多个或全部特征1,2,3···之间的综合关联值,recta为矩形函数,a为真时recta=1,a为假时recta=0;对应的物理含义是:事件b的特征a发生或采集到时综合关联值Fb的分子部分考虑相关性数值Vab,而对于未发生或未采集到的特征a综合关联值Fb的分子部分不予考虑相关性数值Vab;[0147]所述目标客户分类系统作为中体体质甄别系统,识别亚健康态的准确程度由以下几点组成[0148]敏感度测试[0149]敏感度定义:针对经典的亚健康态和质的识别能力[0150]测试目的:确定软件针对经典症状的识别能力。[0151]测试方法:[0152]针对经典的23个态和8个质的症状进行样本库制作,通过样本库中每个态的代入,进行结果比对,通常一个态应该有多个样本组成,以确保同一亚健康态样本的多样性。通常一个态的样本数据越大,通常测试结果越接近事实。举例:针对阳虚态有20个用户样本,如果程序针对这20个阳虚样本都可以准确识别,则程序针对阳虚态的敏感度为2020,100%,敏感度为100%。如果针对20个阳虚样本为识别出19个,则敏感度为1920,95%,敏感度为95%〇[0153]测试步骤:[0154]首先进行excel数据模拟测试,以确定专家经验记录的准确程度。[0155]将数据模拟测试合格的态代入到程序中进行测试,以确保程序录入的准确和程序计算的准确。[0156]特异性[0157]特异性定义:针对多个亚健康态的区分能力。[0158]测试目的:确定软件针对经典症状的区分能力。重点测试2种情况,一种是2种或多种近似亚健康态的区分情况。另一种情况为:某种态的相反的态的区分能力。(重点)[0159]测试方法:[0160]针对经典的23个态和8个质的症状制作样本库组合。[0161]组合1:某种态和其近似态的组合。(2个或2个以上,根据该种态的特点而定)[0162]组合2:某种态和其治疗相反的态的组合。[0163]将样本库组合代入,进行结果比对,通常同一个组合应该有多个样本组成,该样本组合数量越大测试结果越接近事实。举例:针对阳虚态组合有20个用户样本,如果程序针对这20个阳虚样本组合都可以准确区分,则程序针对阳虚态组合的特异性为2020,100%,特异性为100%。如果针对20个阳虚样本库组合为识别出19个,则特异性为1920,95%,特异性为95%。[0164]谷错能力[0165]容错能力定义:针对用户在使用软件时,选项错误,但程序依然能准确识别或区分亚健康态的能力。[0166]测试目的:针对程序对每种亚健康态的敏感度和特异性测试的容错能力。[0167]解释:针对敏感度和特异性的测试中,测试软件在答错几道题目的情况下,依然可以保证敏感度和特异性不变。暂时用答错题目百分比来进行衡量,敏感度和特异性分别表不。[0168]虽然已参照几个典型实施例描述了本发明,但应当理解,所用的术语是说明和示例性、而非限制性的术语。由于本发明能够以多种形式具体实施而不脱离发明的精神或实质,所以应当理解,上述实施例不限于任何前述的细节,而应在随附权利要求所限定的精神和范围内广泛地解释,因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。

权利要求:1.一种目标客户分类系统,包括:用户基本信息采集单元,通过人机交互界面采集用户基本信息;用户基本信息分析单元,对用户基本信息采集单元采集到的用户基本信息进行分析以确定该用户的初级类别;次级用户信息采集单元生成单元,用于根据所述用户的初级类别,生成用于进一步采集用户信息的包括次级用户信息选项的人机交互界面;次级用户信息采集单元,将所述人机交互界面提供给用户;计算单元,利用所述次级用户信息采集单元采集到的用户特征数据和数据库单元存储的特征与事件之间的相关性数据计算所述用户特征与事件之间的综合关联值;用户分类单元,对所述计算单元计算的所述相关值对用户进行分类;结果输出单元,输出分类结果。2.如权利要求1所述的目标客户分类系统,所述目标客户分类系统还包括数据库单元,用于存储特征与事件之间的相关性数据。3.如权利要求1-2任一项所述的目标客户分类系统,所述特征与事件之间的相关性数据是基于历史经验积累的数据、利用相关性分析获得的相关性数据、和或采用人工智能机器自学习获取的相关性数据。4.如权利要求1-3任一项所述的目标客户分类系统,所述计算单元为专家系统。5.如权利要求1-4任一项所述的目标客户分类系统,所述计算单元为分级嵌套计算单元,包括第一级分级嵌套计算单元到第N级分级嵌套计算单元,N为大于等于2的自然数。6.如权利要求1-5任一项所述的目标客户分类系统,所述数据库单元中存储的特征与事件之间的相关性数据是根据已有的经验数据构建,上述相关性数据不必然是数字,其包括但不限于是比值、百分数、概率。7.如权利要求1-6任一项所述的目标客户分类系统,所述目标客户分类系统为中医体质甄别系统,其可以根据用户输入的系统问询信息推理计算出受试者所属的中医体质。8.如权利要求1-7任一项所述的目标客户分类系统,所述用户基本信息包括:性别、年龄、身高、体重、家族病史。9.如权利要求1-8任一项所述的目标客户分类系统,所述次级用户信息包括:用户自身感受、生活习惯、身体症状、运动情况。10.如权利要求1-9任一项所述的目标客户分类系统,所述分类结果为目标客户具体属于何种中医体质。

百度查询: 张莹 一种目标客户分类系统