买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于BERT的智能问答实现方法及系统_武汉烽火普天信息技术有限公司_202010449752.1 

申请/专利权人:武汉烽火普天信息技术有限公司

申请日:2020-05-25

公开(公告)日:2024-04-16

公开(公告)号:CN111538824B

主分类号:G06F16/332

分类号:G06F16/332;G06F16/35;G06F16/31;G06F16/36;G06F18/22

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2020.11.17#实质审查的生效;2020.08.14#公开

摘要:本发明涉及一种基于BERT的智能问答实现方法及系统,所述方法具体包括以下步骤:S1:接收用户输入的问题;S2:将用户输入的问题规范化;S3:经预处理模块处理之后的问题输入基于BERT的问题意图分类模型进行分类;S4:从知识库中检索相应问题和对应的答案,得到候选问题集及对应的答案集;S5:将候选问题集和答案集按照一定的规则进行排序;S6:将输入问题和排序后的候选问题集建立匹配对,输入到基于BERT的问题相似度匹配模型中得到相似度;S7:依据候选问题集的相似度得到最终答案,反馈给用户端。本申请的智能问答实现方法及系统,采用了预训练的中文BERT模型,让机器有了先验知识,提高了智能问答的准确性。

主权项:1.一种基于BERT的智能问答实现方法,其特征在于,具体包括以下步骤:S1:接收用户输入的问题;S2:将用户输入的问题规范化,去掉特殊符号、标点符号及停用词,得到处理之后的问题;S3:经处理之后的问题输入基于BERT的问题意图分类模型进行分类,得到输入问题的类别Cq;所述基于BERT的问题意图分类模型的训练过程包括:收集领域内相关问题和对应的分类集,得到问题、分类的一一对应关系,经预处理特征处理之后得到问题的向量化表示,接着配合预训练的中文BERT模型进行微调,得到基于BERT的问题意图分类模型;S4:检索模块首先参考领域词典将输入问题q分隔为w1,w2…wi…wn,其中wi是分隔开的第i个词,采用w1∪w2∪…wi∪…wn∩Cq的查询公式,从知识库中检索相应问题和对应的答案,得到候选问题集及对应的答案集,所述知识库内存有领域问题合集和对应的答案合集,且所述领域问题和对应答案通过建立索引的方式存储在知识库中;S5:将候选问题集和答案集按照一定的规则进行排序;排序模块采用TF-IDF统计方法对候选问题集Q和对应的答案集A进行排序,得到与Q和A对应的集合Score,这里设定一个得分阈值Scoremin,如果ScoreiScoremin,则保存相应的Qi和Ai,剩余的问题集和相对应的答案集为RQ和RA;S6:将输入问题和排序后的候选问题集建立匹配对,输入到基于BERT的问题相似度匹配模型中得到相似度;匹配算法模块将剩余的问题集RQ中的问题取出来,输入的问题q,建立一个匹配对RQi,q,输入到基于BERT的问题相似度匹配模型中,得到一个匹配的概率pi,通过统计得到RQ中问题的概率最大值pmax,这里设定一个概率阈值pmin,如果pmax=pmin,则确定RQi是符合要求的问题,反之在剩余的问题集中没有符合要求的问题;所述基于BERT的问题相似度匹配模型的训练过程包括:收集领域内相关问题集,进行正样本扩充、负样本扩充之后得到相似问题集,然后再预处理、特征处理得到问题的向量化表示,接着配合预训练的中文BERT模型进行微调,得到基于BERT的问题相似度匹配模型;S7:依据候选问题集的相似度得到最终答案,反馈给用户端。

全文数据:

权利要求:

百度查询: 武汉烽火普天信息技术有限公司 一种基于BERT的智能问答实现方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。