买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】应用于释义文档的检索信息生成方法、装置和电子设备_中信证券股份有限公司_202410108126.4 

申请/专利权人:中信证券股份有限公司

申请日:2024-01-26

公开(公告)日:2024-04-12

公开(公告)号:CN117633197B

主分类号:G06F16/332

分类号:G06F16/332;G06F16/33;G06F16/31;G06F16/35;G06F40/35;G06N5/04;G06N3/0455

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2024.03.19#实质审查的生效;2024.03.01#公开

摘要:本公开的实施例公开了应用于释义文档的检索信息生成方法、装置和电子设备。该方法的一具体实施方式包括:对信息查询用户输入的查询语句进行意图识别;响应于确定意图状态信息表征文档检索意图,执行以下第一处理步骤:对预先构建的文档检索索引进行索引激活;通过激活后文档索引进行释义文档内容定位;响应于确定意图状态信息表征知识问答意图,执行以下第二处理步骤:确定是否存在目标问答信息对序列;响应于存在目标问答信息对序列,对目标问答信息对序列中的每个目标问答信息对进行问答信息补充;将目标问答信息对序列和目标问答信息对对应的问答补充信息,确定为与查询语句匹配的检索信息。该实施方式提高了检索效率。

主权项:1.一种应用于释义文档的检索信息生成方法,包括:对信息查询用户输入的查询语句进行意图识别,以生成意图状态信息,其中,所述意图状态信息表征所述信息查询用户的查询意图;响应于确定所述意图状态信息表征文档检索意图,执行以下第一处理步骤:根据所述查询语句和所述信息查询用户的用户信息,对预先构建的文档检索索引进行索引激活,以生成激活后文档索引,其中,所述文档检索索引是用于进行释义文档检索的检索索引,所述激活后文档索引为所述文档检索索引的子索引,所述文档检索索引包括:一级检索索引、二级检索索引和三级检索索引,所述一级检索索引的索引检索顺序先于所述二级检索索引的检索顺序,所述二级检索索引的索引检索顺序先于所述三级检索索引的检索顺序;以所述查询语句为查询源,通过所述激活后文档索引进行释义文档内容定位,得到与所述查询语句匹配的检索信息;响应于确定所述意图状态信息表征知识问答意图,执行以下第二处理步骤:确定是否存在目标问答信息对序列,其中,所述目标问答信息对序列中的目标问答信息对根据与所述查询语句的问答关联度有序排列;响应于存在所述目标问答信息对序列,对所述目标问答信息对序列中的每个目标问答信息对进行问答信息补充,以生成与所述目标问答信息对对应的问答补充信息;将所述目标问答信息对序列和目标问答信息对对应的问答补充信息,确定为与所述查询语句匹配的检索信息,其中,文档检索索引通过以下步骤生成:确定候选释义文档集合,其中,所述候选释义文档集合中的候选释义文档是待进行检索索引建立的文档;根据候选释义文档对应的文档所属信息,对所述候选释义文档集合中的候选释义文档进行粗粒度聚类,以生成候选释义文档组集合,其中,候选释义文档组中的各个候选释义文档对应相同的簇中心;对于所述候选释义文档组集合中的每个候选释义文档,执行以下一级索引生成步骤:确定所述候选释义文档对应的历史查阅信息集合,其中,所述历史查阅信息集合中的历史查询信息包括:历史查询语句、浏览时长、查阅用户信息、历史检索信息和文档点击量;根据候选释义文档对应的历史查阅信息集合,对所述候选释义文档组集合中的候选释义文档进行细粒度聚类,得到聚类后释义文档组集合;根据所述聚类后释义文档组集合,生成所述一级检索索引,其中,所述一级检索索引中的索引节点对应聚类后释义文档组,其中,在所述根据所述聚类后释义文档组集合,生成所述一级检索索引之后,所述方法还包括:对于所述候选释义文档集合中的每个候选释义文档执行以下二级索引生成步骤:确定所述候选释义文档对应的文档描述信息;确定所述候选释义文档对应的业务流程信息,其中,所述业务流程信息包括:至少一个业务节点;对于所述至少一个业务节点中的每个业务节点,确定所述业务节点涉及的、与所述候选释义文档释义近义匹配的释义文档,作为所述候选释义文档对应的关联释义文档;根据得到的关联释义文档组集合和得到的文档描述信息集合,生成二级检索索引,其中,所述二级检索索引中的索引节点对应候选释义文档,所述二级检索索引中存在关联关系的候选释义文档对应的索引节点之间存在双向边;对于所述候选释义文档集合中的每个候选释义文档执行以下三级索引生成步骤:对所述候选释义文档进行文档解构,以生成文档结构信息,其中,所述文档结构信息包括:块级释义文档信息集合,块级释义文档信息包括:文档释义块和文档释义块结构信息;对于块级释义文档信息集合中的每个块级释义文档信息,根据所述块级释义文档信息包括的文档释义块结构信息,通过预先构建的文本特征压缩模型,对所述块级释义文档信息包括的文档释义块进行文本特征压缩,以生成文本释义块向量;根据得到的文本释义块向量组集合,构建所述三级检索索引,其中,文本释义块向量组为候选释义文档对应的至少一个文本释义块向量,所述三级检索索引中的索引节点与所述二级索引中对应的索引节点之间垂直关联。

全文数据:

权利要求:

百度查询: 中信证券股份有限公司 应用于释义文档的检索信息生成方法、装置和电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。