无锡锡商银行股份有限公司于天星获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉无锡锡商银行股份有限公司申请的专利一种大语言模型多级检索增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119311806B 。
龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411862661.5,技术领域涉及:G06F16/332;该发明授权一种大语言模型多级检索增强方法是由于天星;杨赛;顾全林;孙梦婷;宋成成设计研发完成,并于2024-12-17向国家知识产权局提交的专利申请。
本一种大语言模型多级检索增强方法在说明书摘要公布了:本发明公开了一种大语言模型多级检索增强方法,具体涉及多级检索技术领域,通过对用户输入的查询进行初始解析和生成核心查询语句以及初级检索文档集,更准确地理解用户的查询意图,对初级检索文档集进行聚类分析并识别出冗余风险文档集、保留文档集以及信息缺失风险文档集,获取冗余风险文档集的冗余检测信息和可信度评估信息,对冗余风险文档集进行初次筛选,有效过滤冗余且可信度较低的检索文档,根据信息缺失风险文档集生成补充查询语句在知识库中进行二次检索,更全面地覆盖用户的多角度需求和潜在的模糊意图,通过文档质量系数和文档新鲜度系数的综合计算,生成文档优先级推荐指数,确保质量高且时效性强的文档优先展示给用户,提升用户体验。
本发明授权一种大语言模型多级检索增强方法在权利要求书中公布了:1.一种大语言模型多级检索增强方法,其特征在于:包括如下步骤: 步骤S1,对用户输入的查询进行初始解析,并根据初始解析结果生成核心查询语句,根据核心查询语句在知识库中进行初级检索,得到初级检索文档集; 将用户输入的查询进行分词处理,提取出重要的关键词和短语; 对分词后的词语进行词性标注,识别出名词、动词、形容词不同词性的词语; 将标注后的词语输入主题模型,提取输入查询中的查询主题; 将提取的查询主题词和查询主题短语作为核心查询语句; 使用生成的核心查询语句在知识库中执行初级检索,获取与核心查询语句相关的初级检索文档集; 步骤S2,对初级检索文档集进行聚类分析并识别出冗余风险文档集、保留文档集以及信息缺失风险文档集; 步骤S3,获取冗余风险文档集的冗余检测信息和可信度评估信息,对冗余风险文档集进行初次筛选,得到冗余文档筛选集; 步骤S4,根据信息缺失风险文档集生成补充查询语句,根据补充查询语句在知识库中进行二次检索,得到信息补充文档集; 步骤S5,将保留文档集、冗余文档筛选集、信息补充文档集进行合并,得到最终文档集,获取最终文档集的文档检索质量信息和文档新鲜度信息,生成文档优先级推荐指数,根据文档优先级推荐指数对最终文档集中的文档进行由大到小进行排序,得到文档排序表,并按照文档排序顺序将文档依次向用户进行展示; 所述的文档检索质量信息包括文档检索质量系数,文档新鲜度信息包括文档新鲜度系数; 文档检索质量系数的获取逻辑如下: 对最终文档集中的检索文档和用户输入查询进行预处理,包括分词、去除停用词、词干提取; 计算文档检索质量系数jsz,表达式如下 式中N表示最终文档集中检索文档的总数量,qi表示用户输入查询中的第i个词语,i={1,2,...,n},n为正整数,cpqi,D表示qi在检索文档D中的词频,CD表示检索文档D的文档长度,pjc表示最终文档集中检索文档的平均长度,M和L是常数因子; 所述M是用于控制词频对文档检索质量系数影响的常数因子,L是用于调节检索文档的文档长度对词频影响的常数因子; 文档新鲜度系数的获取逻辑如下: 获取检索文档的发布时间和用户查询时间,计算检索文档的发布时间到用户查询时间的时间差T1; 获取检索文档每一次的内容更新时间,计算相邻内容更新的时间差T2j,j表示内容更新事件触发的次序编号; 计算相邻内容更新的时间差的平均值TPJ,表达式如下式中j={1,2,...,J}; 计算相邻内容更新的时间差的标准差TPB,表达式如下 计算文档新鲜度系数wdj,表达式如下
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人无锡锡商银行股份有限公司,其通讯地址为:214000 江苏省无锡市锡山区安镇街道东翔路578号红豆财富广场1-2层、5-11层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。