买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】用于在深度学习中对基于语义的篇章进行分层获取的系统和方法_易享信息技术有限公司_202280045940.5 

申请/专利权人:易享信息技术有限公司

申请日:2022-01-26

公开(公告)日:2024-02-20

公开(公告)号:CN117581223A

主分类号:G06F16/9032

分类号:G06F16/9032

优先权:["20210517 US 63/189,505","20211123 US 17/533,613"]

专利状态码:在审-实质审查的生效

法律状态:2024.03.08#实质审查的生效;2024.02.20#公开

摘要:本文描述的实施方案提供了用于使用文档级密集获取模型和篇章级密集获取模型对文档的语料库进行开放域问答的密集分层获取。具体地,每个文档被视为具有章节、子章节和段落的结构集合。每个文档可以被拆分成短长度篇章,其中可以应用文档级获取模型和篇章级获取模型来返回较小的一组经过滤文本。在对问题和文档进行编码并确定与经编码问题的文档相关性得分之后,可以标识前位文档。此后,基于篇章的编码以及确定与经编码问题的篇章相关性得分,进一步标识前位篇章的集合。可以组合使用文档相关性得分和篇章相关性得分,以确定具有前位篇章的集合的文档的最终获取排序。

主权项:1.一种用于在深度学习中进行密集分层获取的系统,所述系统包括:非暂态存储器,其存储机器可执行代码;和一个或多个硬件处理器,其联接至所述非暂态存储器并且能够配置为执行所述机器可执行代码,以使所述一个或多个硬件处理器执行包括如下的操作:接收针对文档的语料库的问题,其中所述语料库中的所述文档与篇章的相应集合相关联;访问所述文档的所述语料库和针对所述文档的经编码文档的索引,其中所述经编码文档基于所述文档的摘要或所述文档的线性化内容表中的至少一个;针对所述文档的文档级获取模型和所述篇章的篇章级获取模型,对所述问题进行编码;使用所述文档级获取模型,确定所述文档对于所述问题的文档相关性得分,其中所述文档相关性得分基于所述经编码问题和所述经编码文档;使用所述文档相关性得分,从所述文档过滤无关文档,以标识所述文档中的至少一个文档;使用所述篇章的所述篇章级获取模型,对所述文档中的所述至少一个文档中的所述篇章进行编码,其中对所述篇章进行编码进一步使用所述文档中的所述至少一个文档的至少一个文档结构;和使用所述文档相关性得分和所述经编码篇章,从所述文档中的所述至少一个文档获得针对所述问题的前位评级篇章。

全文数据:

权利要求:

百度查询: 易享信息技术有限公司 用于在深度学习中对基于语义的篇章进行分层获取的系统和方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。