申请/专利权人:武汉大学
申请日:2020-02-24
公开(公告)日:2020-06-23
公开(公告)号:CN111324717A
主分类号:G06F16/332(20190101)
分类号:G06F16/332(20190101);G06F40/30(20200101);G06N3/04(20060101);G06N3/08(20060101)
优先权:
专利状态码:有效-授权
法律状态:2023.06.27#授权;2020.07.17#实质审查的生效;2020.06.23#公开
摘要:本发明公开了一种面向开放域问答的基于机器阅读理解的答案获取方法,采用基于BERT的语义编码模块和信息交互注意力网络,深入地捕获问题和文档的潜在语义表示,有效地提取并融合问题和文档间的信息,捕获问题与文档的全局特征;采用基于PointerNetworks的答案获取模块,将注意力权重作为指针,更加准确地定位所预测答案的起止位置。本发明提出的一种面向开放域问答的基于阅读理解的答案获取方法,在CMRC2018数据集上进行实证评估。实验结果表明,该发明能够达到开放域问答任务标准水平,并取得了优异的表现。
主权项:1.一种面向开放域问答的基于机器阅读理解的答案获取方法,其特征在于,包括:S1:获取阅读理解数据集,划分出训练集、验证集和测试集,对获取的阅读理解数据集进行预处理;S2:构建阅读理解的答案获取模型,阅读理解的答案获取模型包括文档和问题的语义编码模块、信息交互编码模块以及答案获取模块,其中,文档和问题的语义编码模块用于从输入的数据集中捕获和编码得到文档的上下文语义表示和问题的上下文语义表示,信息交互编码模块用于根据文档的上下文语义表示和问题的上下文语义表示,捕获和编码得到与问题相关的文档编码表示,答案获取模块用于根据与问题相关的文档编码表示,获取答案;S3:根据划分出的训练集和设置的损失函数,对阅读理解的答案获取模型包含的文档和问题的语义编码模块、信息交互编码模块以及答案获取模块进行联合训练,获得训练好的阅读理解的答案获取模型;S4:利用训练好的阅读理解的答案获取模型对待处理的数据进行预测,得到对应的答案。
全文数据:
权利要求:
百度查询: 武汉大学 一种面向开放域问答的基于机器阅读理解的答案获取方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。