买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于句法分析的问答系统答案生成方法_上海交通大学_201911239244.4 

申请/专利权人:上海交通大学

申请日:2019-12-06

公开(公告)日:2024-03-15

公开(公告)号:CN110955768B

主分类号:G06F16/332

分类号:G06F16/332;G06F40/211;G06F40/289

优先权:

专利状态码:有效-授权

法律状态:2024.03.15#授权;2020.05.01#实质审查的生效;2020.04.03#公开

摘要:本发明公开了一种基于句法分析的问答系统答案生成方法,其步骤包括:S1获得问题信息以及多篇文本信息对应的数学表达;S2计算各篇所述本文信息包含所述问题信息对应的答案的概率,并根据包含所述答案的概率选取若干篇所述文本信息作为新篇章;S3利用神经网络计算各所述新篇章中每个单词成为所述答案的概率,并计算各所述新篇章中各句子的句法树;S4结合上述每个词成为所述答案的概率和所述每个句子的句法树选取多个片段,并根据选取的多个所述片段组成所述问题信息的答案。这种答案生成方式得到的答案由若干短语构成,其内容精炼,符合语言规律,具有更好的可读性。

主权项:1.一种基于句法分析的问答系统答案生成方法,其特征在于,包括以下步骤:S1获得问题信息以及多篇文本信息对应的数学表达;S2计算各篇所述本文信息包含所述问题信息对应的答案的概率,并根据包含所述答案的概率选取若干篇所述文本信息作为新篇章;S3利用神经网络计算各所述新篇章中每个单词成为所述答案的概率,并计算各所述新篇章中各句子的句法树;该神经网络利用LSTM进行编码,再由多层感知机将编码后的表达映射到一个和文本等长的向量,向量的每一位代表文本中对应词成为答案的概率;S4结合每个词成为所述答案的概率和每个句子的句法树选取多个片段,并根据选取的多个所述片段组成所述问题信息的答案;上述步骤S4中,选取多个片段包括以下步骤:S401根据句法树将各句子划分为短语,并根据长度上限a和长度下限b对短语进行筛选;S402对各短语中每个单词成为所述答案的概率求算数平均值,作为各短语成为答案的概率;S403选取短语的过程中,将成为答案的概率大于设定阈值的短语进行标记;在上述步骤S4中,根据上述的多个片段组成所述问题信息的答案包括以下步骤:S411将各所述新篇章按照包含所述答案的概率从高到低排列,并组成单个最终文本;S412根据步骤S403中标记,将最终文本中没有标记的短语和单词删除,并将标记的短语依次串接,得到答案;上述步骤S1包括:S11接收问题信息和多篇文本信息;S22利用预训练语言模型分别对问题信息和多篇文本信息分别编码得到它们的数学表达。

全文数据:

权利要求:

百度查询: 上海交通大学 一种基于句法分析的问答系统答案生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。