买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】聊天应答方法及系统、电子装置及可读存储介质_平安科技(深圳)有限公司_201910342725.1 

申请/专利权人:平安科技(深圳)有限公司

申请日:2019-04-26

公开(公告)日:2024-03-15

公开(公告)号:CN110209783B

主分类号:G06F16/332

分类号:G06F16/332

优先权:

专利状态码:有效-授权

法律状态:2024.03.15#授权;2021.09.24#实质审查的生效;2019.09.06#公开

摘要:本发明公开了一种聊天应答方法及系统、电子装置及可读存储介质,该方法包括:获取提问信息,及调用已训练的用于得到应答信息的聊天模型,根据上述提问信息及聊天模型,对聊天模型对应的词汇集合中词语的输出概率进行随机性变化,及基于随机性变化后的目标输出概率进行词语选择,得到提问信息对应的应答信息,输出该应答信息。相对于技术,通过对聊天模型对应的词汇集合中词语的输出概率进行随机性变化,增强了选择的词语的随机性,也增强了得到的应答信息的随机性,有效避免应答的重复率过高的问题,提高应答的灵活性和趣味性。

主权项:1.一种聊天应答方法,其特征在于,所述方法包括:获取提问信息,及调用已训练的用于得到应答信息的聊天模型;根据所述提问信息及所述聊天模型,对所述聊天模型对应的词汇集合中词语的输出概率进行随机性变换,及基于随机性变换后的目标输出概率进行词语选择,得到所述提问信息对应的应答信息;其中,随机性变换包括利用预设的随机变换算法及随机参数值对各词语的输出概率进行变换,所述随机变换算法包括:n表示第n个词语,i用于表示n的取值,n的初始值为1,n的最大值为N,N为词汇集合中词语的总数,Pn'表示第n个词语变换后的输出概率,Pn表示聊天模型输出的第n个词语的输出概率,M表示随机参数值;输出所述提问信息对应的应答信息。

全文数据:聊天应答方法及系统、电子装置及可读存储介质技术领域本发明涉及计算机领域,尤其涉及一种聊天应答方法及系统、电子装置及可读存储介质。背景技术随着科技的发展,人工智能正在逐步改变着人类的生活方式,例如,聊天机器人就是其中一种,当客户通过文字或者语音与聊天机器人进行互动时,聊天机器人可以为客户进行智能应答。然而目前的聊天机器人对于问题的应答方式比较固定,采用的是贪婪采样的方式,即选择可能性最大的语言进行标记,这种方法的缺陷是使得一个问题得到的应答重复率过高,且对于人类而言没有任何意外,应答的灵活性和趣味性低。发明内容本发明的主要目的在于提供一种聊天应答方法及系统、电子装置及可读存储介质,旨在解决现有技术中应答的重复率过高,灵活性和趣味性低的技术问题。为实现上述目的,本发明第一方面提供一种聊天应答方法,包括:获取提问信息,及调用已训练的用于得到应答信息的聊天模型;根据所述提问信息及所述聊天模型,对所述聊天模型对应的词汇集合中词语的输出概率进行随机性变换,及基于随机性变换后的目标输出概率进行词语选择,得到所述提问信息对应的应答信息;输出所述提问信息对应的应答信息。为实现上述目的,本发明第二方面提供一种聊天应答系统,该系统包括:。获取调用模块,用于获取提问信息,及调用已训练的用于得到应答信息的聊天模型;随机变换模块,用于根据所述提问信息及所述聊天模型,对所述聊天模型对应的词汇集合中词语的输出概率进行随机性变换,及基于随机性变换后的目标输出概率进行词语选择,得到所述提问信息对应的应答信息;输出,用于输出所述提问信息对应的应答信息。为实现上述目的,本发明第三方面提供一种电子装置,包括:存储器、处理器及存储在存储器上且在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如第一方面所述的聊天应答方法中的各个步骤。为实现上述目的,本发明第四方面提供一种可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如第一方面所述的聊天应答方法中的各个步骤。本发明提供一种聊天应答方法,该方法包括:获取提问信息,及调用已训练的用于得到应答信息的聊天模型,根据上述提问信息及聊天模型,对聊天模型对应的词汇集合中词语的输出概率进行随机性变化,及基于随机性变化后的目标输出概率进行词语选择,得到提问信息对应的应答信息,输出该应答信息。相对于技术,通过对聊天模型对应的词汇集合中词语的输出概率进行随机性变化,增强了选择的词语的随机性,也增强了得到的应答信息的随机性,有效避免应答的重复率过高的问题,提高应答的灵活性和趣味性。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例中聊天模型的训练方法的流程示意图;图2为本发明实施例中聊天应答方法的流程示意图;图3为图2所示实施例中步骤201的细化步骤的流程示意图;图4为图3所示实施例中步骤301的细化步骤的流程示意图;图5为本发明实施例中聊天应答系统的结构示意图;图6为本发明实施例中电子装置的结构示意图。具体实施方式为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在本发明实施例中,上述聊天应答方法可以由聊天应答系统实现,该系统可以是程序模块,且该程序模块存储于具有聊天应答功能的设备的可读存储介质内,该设备在执行聊天应答功能时,可以由处理器调用并运行存储介质中的上述聊天应答系统,以实现上述聊天应答方法。其中,该聊天应答方法中需要使用已训练的用于得到应答信息的聊天模型,为了更好的理解本发明实施例中的技术方案,下面将介绍上述聊天应答模型的训练方法。请参阅图1,为本发明实施例中聊天模型的训练方法的流程示意图,可以理解的是,该聊天模型的训练方法是属于聊天应答方法的一部分,包括:步骤101、获取多组问答样本对,其中,一组问答样本对包括问题样本信息及对应的应答样本信息;在本发明实施例中,待训练的模型也可以称为初始聊天模型,该初始聊天模型可以是LSTM长短期记忆网络,LongShortTermMemory或者是其他循环神经网络模型,在实际应用中可以基于具体的需要进行聊天模型的类型的选择,此处不做限定。通过对该模型进行训练,可以得到用于得到应答信息的聊天模型。对模型进行训练需要先准备样本,在本申请实施例中,可获取到多组问答样本对,其中,一组问答样本对包括问题样本信息及对应的应答样本信息,该问答样本对可以从网络抓取,或者是预先由人工收集得到。需要说明的是,问答样本对中的问题样本信息并不一定是指问题,可以是问题语句,也可以是其他类型的语句,例如,也可以是陈述语句,在实际应用中,是对话即可。步骤102、对于第h组问答样本对,对第h组问答样本对中的应答样本信息进行分词处理,得到Q个词语;其中,h的取值为[1,H],H为问答样本对的总数,Q,H为正整数;步骤103、将第h组问答样本对中的问题样本信息,及Q个词语中的前q个词语构成输入集合,并将第q+1个词语作为输出,得到第h组问答样本对的Q个训练样本;其中,q的取值为[1,Q-1]。其中,上述问答样本对不能直接用于训练,而是通过对问答样本对的处理得到用于训练的训练样本,假设问答样本对的总数为H组,为了便于理解,以第h组为例进行说明,其中,该h的取值为[1,H],其中,该h及H均为正整数。对于第h组问答样本对,对该第h组中的问答样本对中的应答样本信息进行分词处理,得到Q个词语,且在得到上述Q个词语之后,将第h组问答样本对中的问题样本信息,及Q各词语中的前q个词语构成输入集合,并将第q+1个词语作为输出,得到第h组样本对的Q个训练样本。例如,若问题样本对包含问题A及回答B,则先对回答B进行分词,分词得到的结果为{b1、b2、b3、b4、….bQ},则将问题A作为输入,b1作为输出组成一个训练样本,再将A+b1作为输入,b2作为输出组成一个训练样本,且继续将A+b1+b2作为输入,b3作为输出组成一个训练样本,依次类推,直至将A+b1+b2+b3+b4….+bQ-1作为输入,bQ作为输出,可得到Q个训练样本。又例如,在一组样本问答对中,问题样本信息为:“你喜欢我吗”,应答样本信息为“我喜欢你”,则先对应答样本信息进行分词,分别为“我”、“喜欢”、“你”时,则可以得到3个训练样本,分别为输入“你喜欢我吗”+输出“我”,输入“你喜欢我吗”+“我”、输出“喜欢”,及输入“你喜欢我吗”+“我”+“喜欢”,输出“你”。步骤104、利用多组问答样本对的训练样本对初始聊天模型进行训练,得到聊天模板。在本发明实施例中,在得到多组问答样本对的所有训练样本之后,利用该训练样本对初始聊天模型进行训练,得到聊天模型。进一步的,还将得到上述已训练的聊天模型对应的词汇集合,具体的,在将上述的H组样本问答对中的所有应答样本信息进行分词后,得到集合,对该集合中的词语进行去重处理,得到上述的词汇集合。例如,若N个应答样本信息分词后都存在词语“F”,则在分词后的集合中具有N个词语“F”,去重处理是指删掉重复的N-1个词语“F”,留下一个词语“F”。在本发明实施例中,对于多组问答样本对,分别进行分词处理,及输入输出的训练样本的组合,能够有效得到用于进行训练的训练样本,以便对初始聊天模型进行训练,且可使用训练到的聊天模型通过逐个词语预测的方式,得到输入该聊天模型的问题的应答信息。下面将详细描述利用上述的聊天模型实现聊天应答的过程,请参阅图2,为本发明实施例中聊天应答方法的流程示意图,包括:步骤201、获取提问信息,及调用已训练的用于得到应答信息的聊天模型;步骤201、根据提问信息及聊天模型,对聊天模型对应的词汇集合中词语的输出概率进行随机性变换,及基于随机性变换后的目标输出概率进行词语选择,得到提问信息对应的应答信息;步骤203、输出提问信息对应的应答信息。其中,获取提问信息的方式有多种,例如可以是由提问者在设备的显示屏上输入提问信息,或者可以是采集提问者的语音,并对语音进行语音分析,得到提问信息,或者可以是通过有线或者无线网络接收到其他设备发送的提问信息。进一步的,将上述的提问信息输入已训练得到的聊天模型中,聊天模型将输出其对应的词汇集合中各词语的输出概率,对词汇集合中各词语的输出概率进行随机性变换,及基于随机性变换后的目标输出概率进行词语选择,以得到提问信息对应的应答信息,并最终输出提问信息对应的应答信息。其中,随机性变换是指对各词语的输出概率进行变换,能够增强应答的随机性,有效避免应答的重复率过高的问题,提高应答的灵活性和趣味性。需要说明的是,与聊天模型的训练过程相似,该聊天模型在使用时,是通过逐个选择下一个词语的方式得到完整的应答信息的,因此,对于一个提问信息,需要至少使用一次聊天模型才能够得到应答信息。在本发明实施例中,通过对聊天模型对应的词汇集合中词语的输出概率进行随机性变化,增强了选择的词语的随机性,有效避免应答的重复率过高的问题。其中,请参阅图3,为图2所示实施例中步骤201的细化步骤的流程示意图,包括:步骤301、将提问信息及已得到的应答词语集合,输入聊天模型,得到聊天模型对应的词汇集合中各个词语的输出概率;步骤302、对词汇集合中各个词语的输出概率进行随机性变换,得到变换后的各个词语的目标输出概率;步骤303、基于各个词语的目标输出概率进行词语选择,将选择的词语添加至应答词语集合中,并返回步骤301。其中,对于每一个提问信息,都将建立该提问信息的应答词语集合,且该应答词语集合的初始值为空,该应答词语集合用于按照顺序放置基于聊天模型及随机性变换选择的词语,且通过将该应答词语集合中的各个词语按照选择顺序排序即可得到提问信息对应的应答信息。具体的,将提问信息及已得到的应答词语集合,输出聊天模型,得到该聊天模型对应的词汇集合中各个词语的输出概率,可以理解的是,在应答词语集合为空的情况下,则可以将提问信息输入至聊天模型即可。对于该词汇集合中各个词语的输出概率进行随机性变换,随机性变换是指基于随机的原理在聊天模型输出的各个词语的输出概率的基础上,对各个词语的输出概率进行变换。为了实现上述的随机性变换,需要使用到随机参数值,该参数值可以从预设的随机参数范围内进行随机选择得到,例如,该参数范围可以[0,1]。在得到随机参数值后,利用预设的随机变换算法及该随机参数值对各个词语的输出概率进行变换,得到各个词语的目标输出概率。其中,上述的随机变换算法为:对于第n个词语,采用如下公式计算所述第n个词语变换后的输出概率,n的初始值为1,且n的最大值为N,N为词汇集合中词语的总数:其中,Pn'表示第n个词语变换后的输出概率,Pn表示聊天模型输出的第n个词语的输出概率,M表示随机参数值。通过利用上述的随机变换算法,能够得到词汇集合中各个词语的目标输出概率。进一步的,基于上述各个词语的目标输出概率进行词语选择,且将选择的词语添加至应答词语集合中,此时,即完成了一次词语的选择,可以理解的是,若此次选择的词语不为空,则表明可以继续进行词语的选择,可返回到上述步骤301中,以继续进行下一个词语的选择。若此次选择的词语为空,则表明应答词语集合中的词语可以组成一个应答,可结束此次词语选择的。在本发明实施例中,通过上述的随机性变换,使得选择到的词语具有一定的随机性,灵活性更强。其中,在通过随机性变换,得到词汇集合中各个词语的目标输出概率之后,将基于各个词语的目标输出概率进行词语选择,将选择的词语添加至应答词语集合中。具体的,请参阅图4,为本申请实施例中图3所示实施例中的步骤301的细化步骤的流程示意图,包括:步骤401、对各个词语的目标输出概率按照从大到小的顺序进行排序,得到各个词语的序列;步骤402、遍历序列中的词语,按照遍历到的词语的目标输出概率对遍历到的词语进行词语选择;步骤403、若选择遍历到的词语,则将遍历到的词语添加至应答词语集合中,并返回步骤301;步骤404、若未选择遍历到的词语,且遍历到的词语为序列中的最后一个,则将应答词语集合中的各个词语按照选择的先后顺序构成应答信息。在本发明实施例中,可先对各个词语的目标输出概率进行排序,排序的方式可以为按照目标输出概率从大到小的顺序,得到词汇集合中各个词语的序列。进一步的,对排序得到的序列进行遍历,对于遍历到的词语,按照该词语的目标输出概率对其进行词语选择,例如,若遍历到的词语A的概率为0.6,则表明该词语被选中的概率为0.6,按照其被选中的概率为0.6对其进行选择。其中,若选择遍历到的词语,则将该词语添加至应答词语集合中,且可以理解的是,本申请采用的是逐个预测下一个词语的方式得到应答信息,因此,应答词语集合中包含的词语是按照被选择的顺序进行排序的。其中,若未选择当前遍历到的词语,则遍历下一个词语,并返回上述的步骤402,对其进行选择,直至选择到一个词语,或者,若未选择当前遍历到的词语,且遍历到的词语为上述排序的最后一个,则表明已经完成了整个遍历过程,无法预测到应答词语集合中的最近添加的词语的下一个词语,应答词语集合中已有的词语已可以作为应答信息使用,因此,将应答词语集合中各个词语按照选择的先后顺序构成应答信息,并进行输出。例如,若应答词语集合包含的词语及词语的顺序为:我、今天、要、去、出差,则得到的应答信息为:我今天要去出差。可以理解的是,为了提高处理效率,在对词汇集合中各个词语按照目标输出概率进行排序得到词语的序列之后,可以将该序列中目标输出概率为0的词语先从序列中剔除。基于上述描述,在本发明实施例中,聊天应答系统获取提问信息,及调用已训练的用于得到应答信息的聊天模型,根据上述提问信息及聊天模型,对聊天模型对应的词汇集合中词语的输出概率进行随机性变化,及基于随机性变化后的目标输出概率进行词语选择,得到提问信息对应的应答信息,输出该应答信息。相对于技术,通过对聊天模型对应的词汇集合中词语的输出概率进行随机性变化,增强了选择的词语的随机性,也增强了得到的应答信息的随机性,有效避免应答的重复率过高的问题,提高应答的灵活性和趣味性。请参阅图5,为本发明实施例中聊天应答系统的结构示意图,包括:获取调用模块501,用于获取提问信息,及调用已训练的用于得到应答信息的聊天模型;随机变换模块502,用于根据所述提问信息及所述聊天模型,对所述聊天模型对应的词汇集合中词语的输出概率进行随机性变换,及基于随机性变换后的目标输出概率进行词语选择,得到所述提问信息对应的应答信息;输出模块503,用于输出所述提问信息对应的应答信息。可以理解的是,图5所示实施例中各个模块所执行的步骤与方法实施例中描述的相似,具体可以参阅方法实施例中相关描述,此处不做赘述。在本发明实施例中,通过对聊天模型对应的词汇集合中词语的输出概率进行随机性变化,增强了选择的词语的随机性,也增强了得到的应答信息的随机性,有效避免应答的重复率过高的问题,提高应答的灵活性和趣味性。进一步的,上述随机变换模块502包括:概率输出模块,用于将所述提问信息及已得到的应答词语集合,输入所述聊天模型,得到所述聊天模型对应的词汇集合中各个词语的输出概率;所述应答词语集合的初始值为空;变换模块,用于对所述词汇集合中各个词语的输出概率进行随机性变换,得到变换后的所述各个词语的目标输出概率;选择模块,用于基于所述各个词语的目标输出概率进行词语选择,将选择的词语添加至所述应答词语集合中,并返回所述将所述提问信息及已得到的应答词语集合,输入所述聊天模型的步骤,直至得到所述提问信息对应的应答信息。其中,上述变换模块具体用于:从预设的随机参数范围内随机选择随机参数值;利用预设的随机变换算法及所述随机参数值对所述各个词语的输出概率进行变换,得到所述各个词语的目标输出概率。且进一步的,上述变换模块具体用于:从预设的随机参数范围内随机选择随机参数值。对于第n个词语,采用如下公式计算所述第n个词语变换后的输出概率,n的初始值为1,且n的最大值为N,N为所述各个词语的总数:其中,Pn'表示第n个词语变换后的输出概率,Pn表示第n个词语的输出概率,M表示所述随机参数值。进一步的,上述选择模块具体包括:排序模块,用于对所述各个词语的目标输出概率按照从大到小的顺序进行排序,得到所述各个词语的序列;遍历选择模块,用于遍历所述序列中的词语,按照遍历到的词语的目标输出概率对所述遍历到的词语进行词语选择;添加返回模块,用于若选择所述遍历到的词语,则将所述遍历到的词语添加至所述应答词语集合中,并返回上述的概率输出模块;构建模块,用于若未选择所述遍历到的词语,且所述遍历到的词语为所述序列中的最后一个,则将所述应答词语集合中的各个词语按照选择的先后顺序构成所述应答信息。在本发明实施例中,上述的聊天模型是通过训练得到的,因此,上述的聊天应答系统还包括:样本获取模块,用于获取多组问答样本对,其中,一组问答样本对包括问题样本信息及对应的应答样本信息;分词模块,用于对于第h组问答样本对,对所述第h组问答样本对中的应答样本信息进行分词处理,得到Q个词语,所述h的取值为[1,H],H为问答样本对的总数,Q,H为正整数;组合模块,用于将所述第h组问答样本对中的问题样本信息,及所述Q个词语中的前q个词语构成输入集合,并将第q+1个词语作为输出,得到所述第h组问答样本对的Q+1个训练样本,其中,q的取值为[1,Q],且第Q+1个词语为空;训练模块,用于利用所述多组问答样本对的训练样本对初始聊天模型进行训练,得到所述聊天模板。在本发明实施例中,系统将获取提问信息,及调用已训练的用于得到应答信息的聊天模型,根据上述提问信息及聊天模型,对聊天模型对应的词汇集合中词语的输出概率进行随机性变化,及基于随机性变化后的目标输出概率进行词语选择,得到提问信息对应的应答信息,输出该应答信息。相对于技术,通过对聊天模型对应的词汇集合中词语的输出概率进行随机性变化,增强了选择的词语的随机性,也增强了得到的应答信息的随机性,有效避免应答的重复率过高的问题,提高应答的灵活性和趣味性。本发明实施例还提供一种可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现上述的聊天应答方法中的各个步骤。本发明实施例还提供一种电子装置,包括存储器、处理器及存储在存储器上且在处理器上运行的计算机程序,该处理器执行计算机程序时,实现上述的聊天应答方法中的各个步骤。具体的,请参阅图6,图6为本发明实施例提供的一种电子装置的结构示意图。该电子装置可用于方法实施例中的聊天应答方法。如图6所示,该电子装置主要包括:存储器601、处理器602、总线603及存储在存储器601上并可在处理器602上运行的计算机程序,存储器601和处理器602通过总线603连接。处理器602执行该计算机程序时,实现图1或图2所示实施例中的IMS呼叫发起方法。其中,处理器的数量可以是一个或多个。存储器601可以是高速随机存取记忆体RAM,RandomAccessMemory存储器,也可为非不稳定的存储器non-volatilememory,例如磁盘存储器。存储器601用于存储可执行程序代码,处理器602与存储器601耦合。存储器601可称为计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时方法实施例中的聊天应答方法。进一步的,该计算机可存储介质还可以是U盘、移动硬盘、只读存储器ROM,Read-OnlyMemory、RAM、磁碟或者光盘等各种可以存储程序代码的介质。在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备可以是个人计算机,服务器,或者网络设备等执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器ROM,Read-OnlyMemory、随机存取存储器RAM,RandomAccessMemory、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。以上为对本发明所提供的一种聊天应答方法及系统、电子装置及可读存储介质的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

权利要求:1.一种聊天应答方法,其特征在于,所述方法包括:获取提问信息,及调用已训练的用于得到应答信息的聊天模型;根据所述提问信息及所述聊天模型,对所述聊天模型对应的词汇集合中词语的输出概率进行随机性变换,及基于随机性变换后的目标输出概率进行词语选择,得到所述提问信息对应的应答信息;输出所述提问信息对应的应答信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述提问信息及所述聊天模型,进行词语的输出概率的随机性变换及所述词语的概率选择,得到所述提问信息对应的应答信息,包括:将所述提问信息及已得到的应答词语集合,输入所述聊天模型,得到所述聊天模型对应的词汇集合中各个词语的输出概率;所述应答词语集合的初始值为空;对所述词汇集合中各个词语的输出概率进行随机性变换,得到变换后的所述各个词语的目标输出概率;基于所述各个词语的目标输出概率进行词语选择,将选择的词语添加至所述应答词语集合中,并返回所述将所述提问信息及已得到的应答词语集合,输入所述聊天模型的步骤,直至得到所述提问信息对应的应答信息。3.根据权利要求2所述的方法,其特征在于,所述对所述词汇集合中各个词语的输出概率进行随机性变换,得到变换后的所述各个词语的目标输出概率,包括:从预设的随机参数范围内随机选择随机参数值;利用预设的随机变换算法及所述随机参数值对所述各个词语的输出概率进行变换,得到所述各个词语的目标输出概率。4.根据权利要求3所述的方法,其特征在于,所述利用预设的随机变换算法及所述随机参数值对所述各个词语的输出概率进行变换,得到所述各个词语的目标输出概率包括:对于第n个词语,采用如下公式计算所述第n个词语变换后的输出概率,n的初始值为1,且n的最大值为N,N为所述各个词语的总数:其中,P′n表示第n个词语变换后的输出概率,Pn表示第n个词语的输出概率,M表示所述随机参数值。5.根据权利要求2所述的方法,其特征在于,所述基于所述各个词语的目标输出概率进行词语选择,将选择的词语添加至所述应答词语集合中包括:对所述各个词语的目标输出概率按照从大到小的顺序进行排序,得到所述各个词语的序列;遍历所述序列中的词语,按照遍历到的词语的目标输出概率对所述遍历到的词语进行词语选择;若选择所述遍历到的词语,则将所述遍历到的词语添加至所述应答词语集合中,并返回所述将所述提问信息及已得到的应答词语集合,输入所述聊天模型的步骤;若未选择所述遍历到的词语,且所述遍历到的词语为所述序列中的最后一个,则将所述应答词语集合中的各个词语按照选择的先后顺序构成所述应答信息。6.根据权利要求1至5所述的方法,其特征在于,所述获取提问信息,及调用已训练的用于得到应答信息的聊天模型之前,还包括:获取多组问答样本对,其中,一组问答样本对包括问题样本信息及对应的应答样本信息;对于第h组问答样本对,对所述第h组问答样本对中的应答样本信息进行分词处理,得到Q个词语,所述h的取值为[1,H],H为问答样本对的总数,Q,H为正整数;将所述第h组问答样本对中的问题样本信息,及所述Q个词语中的前q个词语构成输入集合,并将第q+1个词语作为输出,得到所述第h组问答样本对的Q+1个训练样本,其中,q的取值为[1,Q],且第Q+1个词语为空;利用所述多组问答样本对的训练样本对初始聊天模型进行训练,得到所述聊天模板。7.一种聊天应答系统,其特征在于,所述系统包括:获取调用模块,用于获取提问信息,及调用已训练的用于得到应答信息的聊天模型;随机变换模块,用于根据所述提问信息及所述聊天模型,对所述聊天模型对应的词汇集合中词语的输出概率进行随机性变换,及基于随机性变换后的目标输出概率进行词语选择,得到所述提问信息对应的应答信息;输出模块,用于输出所述提问信息对应的应答信息。8.根据权利要求7所述的系统,其特征在于,所述随机变换模块包括:概率输出模块,用于将所述提问信息及已得到的应答词语集合,输入所述聊天模型,得到所述聊天模型对应的词汇集合中各个词语的输出概率;所述应答词语集合的初始值为空;变换模块,用于对所述词汇集合中各个词语的输出概率进行随机性变换,得到变换后的所述各个词语的目标输出概率;选择模块,用于基于所述各个词语的目标输出概率进行词语选择,将选择的词语添加至所述应答词语集合中,并返回所述将所述提问信息及已得到的应答词语集合,输入所述聊天模型的步骤,直至得到所述提问信息对应的应答信息。9.一种电子装置,包括存储器、处理器及存储在存储器上且在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1至6任意一项所述的聊天应答方法中的各个步骤。10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至7任意一项所述的聊天应答方法中的各个步骤。

百度查询: 平安科技(深圳)有限公司 聊天应答方法及系统、电子装置及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。