【发明授权】基于指令微调和检索增强生成的在线智能问答方法及装置_杭州有赞科技有限公司_202410118530.X

申请/专利权人：杭州有赞科技有限公司

申请日：2024-01-29

公开（公告）日：2024-04-23

公开（公告）号：CN117688163B

主分类号：G06F16/332

分类号：G06F16/332;G06F40/30;G06F18/22;G06F40/211

优先权：

专利状态码：有效-授权

法律状态：2024.04.23#授权;2024.03.29#实质审查的生效;2024.03.12#公开

摘要：本发明公开了基于指令微调和检索增强生成的在线智能问答方法及装置，包括：获取用户在线提问信息，基于大语言模型对用户在线提问信息进行提炼，对经提炼的提问进行相似提问扩充；基于已训练的语义向量模型对用户在线提问和扩充的相似提问进行向量化处理，得到在线提问文本向量；基于两路检索召回策略将在线提问文本向量与预设知识库内的数据进行检索比较得到相似数据后，基于相似数据和TopK策略从对应的缓存区域中召回与相似数据对应的多个目标文本块；基于重排序策略对召回文本块进行重排序，得到重排序文本块；基于大语言模型和提示词，对用户在线提问、召回文本块及重排序文本块进行润色归纳，得到在线回答结果。提升了智能问答准确率。

主权项：1.一种基于指令微调和检索增强生成的在线智能问答方法，其特征在于，所述方法包括：获取用户在线提问信息，基于大规模语言模型对所述用户在线提问信息进行理解和提炼处理，得到经提炼理解的用户在线提问，并基于所述大规模语言模型对所述经提炼理解的用户在线提问进行相似提问扩充，得到扩充的相似提问；其中，所述用户在线提问信息包括用户在线提问、与所述用户在线提问相关的上下文语境信息；基于已训练的语义向量模型对所述用户在线提问和所述扩充的相似提问进行向量化处理，得到在线提问文本向量；其中，在所述基于已训练的语义向量模型对所述用户在线提问和所述扩充的相似提问进行向量化处理的步骤之前，获取用户提问和语料数据，其中，所述语料数据包括与所述用户提问相关的正样本文本信息，以及与所述用户提问不相关的负样本文本信息；以所述用户提问、所述正样本文本信息和所述负样本文本信息为三元组构建语义向量模型的训练语料；基于与所述用户提问相关的场景，在所述用户提问中设置相应的任务指令；基于所述任务指令和所述训练语料对语义向量模型进行指令微调训练，得到所述已训练的语义向量模型；基于两路检索召回策略将所述在线提问文本向量与预设知识库内的数据进行检索比较，从所述预设知识库中得到与所述在线提问文本向量相似的相似数据，并基于所述相似数据和TopK策略从对应的缓存区域中映射召回与所述相似数据对应的多个目标文本块；所述基于两路检索召回策略将所述在线提问文本向量与预设知识库内的数据进行检索比较，从所述预设知识库中得到与所述在线提问文本向量相似的相似数据的步骤包括：第一路是基于向量索引检索策略，计算在线提问文本向量与Milvus向量库中文本向量间的各内积相似度，基于内积相似度得到相似文本向量判定结果；若相似文本向量判定结果为相似，则从Milvus向量库中获取与在线提问文本向量相似的相似文本向量；第二路是基于文本关键词检索策略，计算在线提问文本向量与ES库中文本数据间的各文本相似度，基于文本相似度得到相似文本判定结果；若相似文本判定结果为相似，则从ES库中获取与在线提问文本向量相似的相似文本；基于交叉编码器对所述用户在线提问和召回的多个目标文本块分别进行相关性计算，得到所述用户在线提问与各目标文本块之间的相关性分数，并基于所述用户在线提问与各目标文本块之间的相关性分数对所述召回的多个目标文本块进行重排序，得到重排序文本块；基于所述大规模语言模型和预设的提示词，对所述用户在线提问、所述召回的多个目标文本块及所述重排序文本块进行文字润色处理和词汇归纳处理，得到与所述用户在线提问相对应的在线回答结果。

全文数据：

权利要求：

百度查询：杭州有赞科技有限公司基于指令微调和检索增强生成的在线智能问答方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

下一篇：摄像头安装组件和应用其的仪表屏_深圳市航盛电子股份有限公司_202322569773.9

相关技术

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

摄像头安装组件和应用其的仪表屏_深圳市航盛电子股份有限公司_202322569773.9

一种钢带波纹螺旋管接头防护模具_吉林建工集团有限公司_202322063597.1

一种叠瓦电池片检测用工装_江苏龙恒新能源有限公司_202322351795.8

一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

一种计算机机箱外壳_深圳市丰翼高精密五金有限公司_202322585533.8

一种高精度智能浊度检测装置_江苏奥坤仪表科技有限公司_202322546638.2

一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

一种耐泥沙高密封性水泵控制阀_国电龙达电力设备(天津)有限责任公司_202322437322.X

在线相关技术

一种阻火器在线清理装置_宁夏滨泽新能源科技有限公司_202322367412.6

一种大型地网在线监测装置_云南标普电气检测技术有限公司_202322105205.3

一种氧化管网在线清洗装置_登封市宏昌水泥有限公司_202322386537.3

一种白酒浓度在线测量装置_发泰(天津)科技有限公司_202322510422.0

一种CVD在线原位称重系统和方法_浙江大学_202410122781.5

一种在线回收循环利用的撒砂装置_深圳市卓宝科技股份有限公司_202322557874.4

一种便携式铁路弹条扣压力在线高精度检测装置_上海工程技术大学_201910363618.7

一种高性能管网数据在线编辑方法及系统_杭州领图信息科技有限公司_202410073514.3

一种在线大气细颗粒物浓缩与收集装置和方法_复旦大学_202010727121.1

一种玻璃镀膜表面缺陷在线检测装置_安徽皓视光电科技有限公司_202211286124.1

生成相关技术

气溶胶生成装置及气溶胶生成系统_深圳市合元科技有限公司_202322425016.4

基于生成对抗网络的人偶模特生成算法_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202311484349.2

骨架动作图生成方法、生成装置、计算机设备及介质_深兰科技(上海)有限公司_202110895154.1

生成参数化空间音频表示_诺基亚技术有限公司_202311364414.8

生成参数化空间音频表示_诺基亚技术有限公司_202311364503.2

气溶胶生成装置及其制造方法_韩国烟草人参公社_202080005689.0

报表生成方法及装置_中盈优创资讯科技有限公司_201911043076.1

一种多功能便携式氢气生成装置及一种氢气生成方法_深圳市珐彩科技有限公司_202010330550.5

生成情绪组合内容的方法及装置_三星电子株式会社_202280057521.3

详单生成的方法、装置及计算设备_中国移动通信集团安徽有限公司_202010015473.4

智能相关技术

一种智能锁电控盒及智能锁_浙江云电智能科技有限公司_202322681505.6

智能消防窗_中冶建工集团有限公司_202211002268.X

智能胎儿监测带_苏州国科医工科技发展(集团)有限公司_201811512047.0

智能分类垃圾桶_中南大学_202322303899.1

AI数字智能热力站_瑞纳智能设备股份有限公司_202322399989.5

冰箱及智能冰箱系统_松下电器研究开发(苏州)有限公司_202110262127.0

冰箱及智能冰箱系统_松下电器研究开发(苏州)有限公司_202110260782.2

一种智能尺_深圳市烽潮科技有限责任公司_202322698478.3

一种智能牙套的控制系统及智能牙套盒_上海洲洹电子科技有限公司_202322107662.6

一种具有智能轴承检测结构的智能控制面板_广州零六光电设备有限公司_202111106288.7

龙图腾网&IPTOP

【发明授权】基于指令微调和检索增强生成的在线智能问答方法及装置_杭州有赞科技有限公司_202410118530.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务