首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于知识图谱的人机交互联想方法、装置及介质_嗷呜世界(深圳)网络科技有限公司_201910467616.2 

申请/专利权人:嗷呜世界(深圳)网络科技有限公司

申请日:2019-05-31

公开(公告)日:2024-05-17

公开(公告)号:CN110175242B

主分类号:G06F16/36

分类号:G06F16/36;G06F16/332;G06F16/335

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2024.05.07#专利申请权的转移;2019.09.20#实质审查的生效;2019.08.27#公开

摘要:本发明提供的基于知识图谱的人机交互联想方法,获取用户输入的语音信号,将所述语音信号转换为文字信号;提取所述文字信号的核心实体;根据所述核心实体在预设的知识图谱中提取出候选联想实体;将所有的候选联想实体进行排序,定义关联性最强的k个候选联想实体为联想结果;根据所述联想结果生成回复信息。该方法能够模仿人类的联想能力,并根据联想的结果生成对用户输入的回复,既可实现机器人自主在话题间的转换,还可以保障新转换话题与目前话题间的相关性。同时提升机器人的智能化程度,同时让用户感到机器人的回复更加逼真和拟人化。

主权项:1.一种基于知识图谱的人机交互联想方法,其特征在于,包括以下步骤:获取用户输入的语音信号,将所述语音信号转换为文字信号;提取所述文字信号的核心实体;根据所述核心实体在预设的知识图谱中提取出候选联想实体;将所有的候选联想实体进行排序,定义关联性最强的k个候选联想实体为联想结果;根据所述联想结果生成回复信息;所述根据所述核心实体在预设的知识图谱中提取出候选联想实体具体包括:在预设的知识图谱中定位所述核心实体;在预设的知识图谱中,提取出与所述核心实体的实体距离为一跳和或重要多跳范围内的实体,定义该实体为所述候选联想实体;该方法在所述根据所述核心实体在预设的知识图谱中提取出候选联想实体之后,所述将所有的候选联想实体进行排序之前,还包括:根据预设的剪枝特征对所述候选联想实体进行筛选,剔除掉不满足所述剪枝特征的候选联想实体;所述剪枝特征包括热点话题事件、用户记忆图谱和上下文信息。

全文数据:基于知识图谱的人机交互联想方法、装置及介质技术领域本发明属于人机交互技术领域,具体涉及基于知识图谱的人机交互联想方法、装置及介质。背景技术目前,在人机交互领域,机器生成回复的方法有许多,比如:通过预设问答库的方式让机器在问答库中检索一条回答回复给用户,或者是通过机器学习、深度学习的等人工智能方法让机器生成答复等。这些方法虽然得到了较为深入的研究和较为普及的应用,但是其缺点也尤为突出,前者需要预设足够大的问答库,且本质上机器的回复过程并不存在任何智能,机器也不能理解用户的输入;后者,机器生成的答复经常会存在语法错误,或机器的答复高度雷同。另外,上述两种技术生成的回复都较为机械化,影响用户的沟通体验,其根本原因是机器不具有人类的联想能力,不能根据知识、对用户的了解、聊天上下文等进行联想并根据联想的结果生成对用户输入的回复。发明内容针对现有技术中的缺陷,本发明提供一种基于知识图谱的人机交互联想方法、装置及介质,模仿人类的联想能力,并根据联想的结果生成对用户输入的回复。第一方面,一种基于知识图谱的人机交互联想方法,包括以下步骤:获取用户输入的语音信号,将所述语音信号转换为文字信号;提取所述文字信号的核心实体;根据所述核心实体在预设的知识图谱中提取出候选联想实体;将所有的候选联想实体进行排序,定义关联性最强的k个候选联想实体为联想结果;根据所述联想结果生成回复信息。优选地,该方法在所述将所述语音信号转换为文字信号之后,所述提取所述文字信号的核心实体之前,还包括:对所述文字信息进行分词、词性标注和语法分析,获得文字处理结果。优选地,所述提取所述文字信号的核心实体具体包括:根据所述文字处理结果,提取所述文字信号的核心名词和或主语,作为所述核心实体。优选地,所述根据所述核心实体在预设的知识图谱中提取出候选联想实体具体包括:在预设的知识图谱中定位所述核心实体;在预设的知识图谱中,提取出与所述核心实体的实体距离为一跳和或重要多跳范围内的实体,定义该实体为所述候选联想实体。优选地,该方法在所述根据所述核心实体在预设的知识图谱中提取出候选联想实体之后,所述将所有的候选联想实体进行排序之前,还包括:根据预设的剪枝特征对所述候选联想实体进行筛选,剔除掉不满足所述剪枝特征的候选联想实体。优选地,所述剪枝特征包括热点话题事件、用户记忆图谱和上下文信息。优选地,该方法在所述根据所述核心实体在预设的知识图谱中提取出候选联想实体之后,所述将所有的候选联想实体进行排序之前,还包括:在预设的知识图谱中,获取与所述候选联想实体相关的实体,定义该实体为所述候选联想实体。第二方面,一种装置,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行第一方面所述的方法。第三方面,一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行第一方面所述的方法。由上述技术方案可知,本发明提供的基于知识图谱的人机交互联想方法、装置及介质,能够模仿人类的联想能力,并根据联想的结果生成对用户输入的回复,既可实现机器人自主在话题间的转换,还可以保障新转换话题与目前话题间的相关性。同时提升机器人的智能化程度,同时让用户感到机器人的回复更加逼真和拟人化。附图说明为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。图1为本发明实施例一提供的人机交互联想方法的流程图。图2为本发明实施例四提供的装置的模块框图。具体实施方式下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和或其集合的存在或添加。还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。实施例一:一种基于知识图谱的人机交互联想方法,参见图1,包括以下步骤:S1:获取用户输入的语音信号,将所述语音信号转换为文字信号;S2:提取所述文字信号的核心实体;S3:根据所述核心实体在预设的知识图谱中提取出候选联想实体;具体地,知识图谱是一种信息存储方式,包含实体和实体间的关系,实体为知识图谱中的点,实体间的关系为知识图谱中的边,知识图谱实质上就是由边和点组成的图。S4:将所有的候选联想实体进行排序,定义关联性最强的k个候选联想实体为联想结果;例如:定义排名最高的k个候选联想实体为联想结果。S5:根据所述联想结果生成回复信息。具体地,该方法将用户输入的语音信号转换为文字信号,并提取文字信号中的核心实体,用于标识用户输入的语音信号中想要表达的主要实体。然后在知识图谱中找出与核心实体相关的实体,作为候选联想实体,并对候选联想实体进行筛选,选出关联性最强的若干个实体,并根据选出的实体进行回复。例如:在交互过程中,当用户输入的语音信号为“想吃葡萄”,那么该方法可以根据用户的历史交互记录,联想用户在水果中除了喜欢葡萄还喜欢苹果,于是,可以生成回复信息“我记得你最喜欢的水果是葡萄,不过我印象中你也挺喜欢苹果的”。该方法能够模仿人类的联想能力,并根据联想的结果生成对用户输入的回复,既可实现机器人自主在话题间的转换,还可以保障新转换话题与目前话题间的相关性。同时提升机器人的智能化程度,同时让用户感到机器人的回复更加逼真和拟人化。实施例二:实施例二在实施例一的基础上增加了以下内容:该方法在所述将所述语音信号转换为文字信号之后,所述提取所述文字信号的核心实体之前,还包括:对所述文字信息进行分词、词性标注和语法分析,获得文字处理结果。具体地,词性标注是指将指定句子内的单词按其含义和上下文内容进行标记的过程。该方法还对完成词性标注的文字信息进行语法分析,方便后续准确地提取出核心实体。优选地,所述提取所述文字信号的核心实体具体包括:根据所述文字处理结果,提取所述文字信号的核心名词和或主语,作为所述核心实体。具体地,例如:用户输入的语音信号为“明星A主持的节目A最近要开播了吗”,则定义该语音信号中的核心名词“节目A”为核心实体。用户输入的语音信号为“电影B要上映了,我好想去看啊”,则定义语音信号中的主语“电影B”为核心实体。本发明实施例所提供的方法,为简要描述,实施例部分未提及之处,可参考前述方法实施例中相应内容。实施例三:实施例三在其他实施例的基础上增加以下内容:所述根据所述核心实体在预设的知识图谱中提取出候选联想实体具体包括:在预设的知识图谱中定位所述核心实体;在预设的知识图谱中,提取出与所述核心实体的实体距离为一跳和或重要多跳范围内的实体,定义该实体为所述候选联想实体。具体地,知识图谱中和核心实体直接相连的实体,就是和核心实体距离为一跳范围内,即一跳可达。如果和核心实体中间隔着一个其他实体相连的实体,就是和核心实体距离为两跳范围内。如果和核心实体中间隔着N个其他实体相连的实体,就是和核心实体距离为N+1跳范围内。重要多跳范围内可以由用户根据自身情况进行设置。对于排序排名高、相关性强的实体,则认为是重要多跳。该方法认为与所述核心实体的实体距离为一跳和或重要多跳范围内的实体即为候选联想实体。如果候选联想实体数量较多,需要对候选联想实体进行剪枝筛选。该方法在所述根据所述核心实体在预设的知识图谱中提取出候选联想实体之后,所述将所有的候选联想实体进行排序之前,还包括:根据预设的剪枝特征对所述候选联想实体进行筛选,剔除掉不满足所述剪枝特征的候选联想实体。其中,所述剪枝特征包括热点话题事件、用户记忆图谱和上下文信息。具体地,当候选联想实体数量较多,通过对候选联想实体进行筛选,得到更有价值的联想结果。例如当根据热点话题事件进行剪枝时,认为近期发生的热门事件信息对于对话更加有价值,更优信息量,与热门事件相关的实体应当优先返回。当根据用户记忆图谱进行剪枝时,认为与用户相关的实体应当优先返回。当根据上下文进行剪枝时,认为上下文对话过程中,上文中曾经提到的实体应当优先返回。该方法通过上述多样性指标对候选联想实体进行剪枝,避免同一候选联想实体被多次返回,降低多次返回的候选联想实体的权重。如果候选联想实体数量较少,需要添加更多候选联想实体,例如可以利用词向量方式添加更多候选。该方法在所述根据所述核心实体在预设的知识图谱中提取出候选联想实体之后,所述将所有的候选联想实体进行排序之前,还包括:在预设的知识图谱中,获取与所述候选联想实体相关的实体,定义该实体为所述候选联想实体。例如假设知识图谱中,葡萄与红葡萄酒相关,红葡萄酒属于酒类,与白兰地相关,当用户说自己喜欢喝红葡萄酒时,提取到的候选联想实体为葡萄酒,此时,该方法可以将白兰地增加为候选联想实体,那么此时的候选联想实体包括红葡萄酒和白兰地,则可以回复用户:那你喜欢白兰地吗?本发明实施例所提供的方法,为简要描述,实施例部分未提及之处,可参考前述方法实施例中相应内容。实施例四:一种装置,参见图2,包括处理器801、输入设备802、输出设备803和存储器804,所述处理器801、输入设备802、输出设备803和存储器804通过总线805相互连接,其中,所述存储器804用于存储计算机程序,所述计算机程序包括程序指令,所述处理器801被配置用于调用所述程序指令,执行上述的方法。应当理解,在本发明实施例中,所称处理器801可以是中央处理单元CentralProcessingUnit,CPU,该处理器还可以是其他通用处理器、数字信号处理器DigitalSignalProcessor,DSP、专用集成电路ApplicationSpecificIntegratedCircuit,ASIC、现成可编程门阵列Field-ProgrammableGateArray,FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。输入设备802可以包括触控板、指纹采传感器用于采集用户的指纹信息和指纹的方向信息、麦克风等,输出设备803可以包括显示器LCD等、扬声器等。该存储器804可以包括只读存储器和随机存取存储器,并向处理器801提供指令和数据。存储器804的一部分还可以包括非易失性随机存取存储器。例如,存储器804还可以存储设备类型的信息。本发明实施例所提供的装置,为简要描述,实施例部分未提及之处,可参考前述方法实施例中相应内容。实施例五:一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述的方法。所述计算机可读存储介质可以是前述任一实施例所述的装置的内部存储单元,例如装置的硬盘或内存。所述计算机可读存储介质也可以是所述装置的外部存储设备,例如所述装置上配备的插接式硬盘,智能存储卡SmartMediaCard,SMC,安全数字SecureDigital,SD卡,闪存卡FlashCard等。进一步地,所述计算机可读存储介质还可以既包括所述装置的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述装置所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。本发明实施例所提供的介质,为简要描述,实施例部分未提及之处,可参考前述系统实施例中相应内容。最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

权利要求:1.一种基于知识图谱的人机交互联想方法,其特征在于,包括以下步骤:获取用户输入的语音信号,将所述语音信号转换为文字信号;提取所述文字信号的核心实体;根据所述核心实体在预设的知识图谱中提取出候选联想实体;将所有的候选联想实体进行排序,定义关联性最强的k个候选联想实体为联想结果;根据所述联想结果生成回复信息。2.根据权利要求1所述基于知识图谱的人机交互联想方法,其特征在于,该方法在所述将所述语音信号转换为文字信号之后,所述提取所述文字信号的核心实体之前,还包括:对所述文字信息进行分词、词性标注和语法分析,获得文字处理结果。3.根据权利要求2所述基于知识图谱的人机交互联想方法,其特征在于,所述提取所述文字信号的核心实体具体包括:根据所述文字处理结果,提取所述文字信号的核心名词和或主语,作为所述核心实体。4.根据权利要求1所述基于知识图谱的人机交互联想方法,其特征在于,所述根据所述核心实体在预设的知识图谱中提取出候选联想实体具体包括:在预设的知识图谱中定位所述核心实体;在预设的知识图谱中,提取出与所述核心实体的实体距离为一跳和或重要多跳范围内的实体,定义该实体为所述候选联想实体。5.根据权利要求1所述基于知识图谱的人机交互联想方法,其特征在于,该方法在所述根据所述核心实体在预设的知识图谱中提取出候选联想实体之后,所述将所有的候选联想实体进行排序之前,还包括:根据预设的剪枝特征对所述候选联想实体进行筛选,剔除掉不满足所述剪枝特征的候选联想实体。6.根据权利要求5所述基于知识图谱的人机交互联想方法,其特征在于,所述剪枝特征包括热点话题事件、用户记忆图谱和上下文信息。7.根据权利要求1所述基于知识图谱的人机交互联想方法,其特征在于,该方法在所述根据所述核心实体在预设的知识图谱中提取出候选联想实体之后,所述将所有的候选联想实体进行排序之前,还包括:在预设的知识图谱中,获取与所述候选联想实体相关的实体,定义该实体为所述候选联想实体。8.一种装置,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。9.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。

百度查询: 嗷呜世界(深圳)网络科技有限公司 基于知识图谱的人机交互联想方法、装置及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。