买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于检索增强大语言模型的纠纷化解智能问答系统_南京视察者智能科技有限公司_202311835315.3 

申请/专利权人:南京视察者智能科技有限公司

申请日:2023-12-28

公开(公告)日:2024-04-12

公开(公告)号:CN117874192A

主分类号:G06F16/332

分类号:G06F16/332;G06N5/04;G06F16/33

优先权:

专利状态码:在审-公开

法律状态:2024.04.12#公开

摘要:本发明公开了一种基于检索增强大语言模型的纠纷化解智能问答系统,包括以下步骤:采集纠纷化解领域的法律法规、权责清单、案例经验等数据,构建纠纷化解知识库;将纠纷化解知识库中的数据进行向量化,构建纠纷化解知识向量库;基于纠纷化解知识库和纠纷化解知识向量库检索输入问题的相关纠纷化解知识;将输入问题和检索出来的相关纠纷化解知识按照提示模板生成提示内容,输入大语言模型后,输出回答。本发明在开源可商用的大语言模型基础上外挂纠纷化解领域的数据源来增强大语言模型对纠纷化解领域的专业问答能力,全程无需领域专家进行频繁问答对数据集的人工构建,而且由于使用了大语言模型,可以避免因表达方式差异导致系统表现较差的问题。

主权项:1.一种基于检索增强大语言模型的纠纷化解智能问答系统,其特征在于,其构建基于如下步骤:步骤1,基于数据采集技术,采集纠纷化解领域的法律法规、权责清单、案例经验等数据,构建纠纷化解知识库;步骤2,基于文本向量化技术,将纠纷化解知识库中的数据进行向量化,构建纠纷化解知识向量库;步骤3,基于所述纠纷化解知识库和所述纠纷化解知识向量库检索输入问题的相关纠纷化解知识,具体如下:步骤3.1,使用ik_smart模式的ik分词器对输入问题进行分词处理,得到分词结果Q,包含关键词q1,q2,…,qn;步骤3.2,从所述纠纷化解知识库中检索出包含Q中任一关键词的文档D,并通过如下算法公式计算文档的相关性得分: 其中,Q表示分词结果,q1,q2,…,qn表示Q中包含的关键词;IDFqi表示逆文档频率,算法公式如下:N表示所有文档数量,nqi表示包含qi的文档数量,ln函数是自然对数;TFqi,D表示词频,算法公式如下:|D|表示文档D包含的词语数量,dqi表示文档D包含的词语中qi出现的次数;avgdl表示所有文档包含的词语数量的平均值;k1和b是两个超参数可调节变量,分别控制非线性词频归一化和文档长度对于分数的惩罚粒度;步骤3.3,将从纠纷化解知识库KD中检索出的文档按照相关性得分进行排序,筛选出得分最高的K1个文档;步骤3.4,从纠纷化解知识向量库KVD中检索出相似度得分最高的K2个文档,相似度得分算法公式如下: 其中,VecD表示文档D输入文本嵌入模型后输出的文本向量;VecQ表示问题输入文本嵌入模型后输出的文本向量;|·|表示计算向量的模长;步骤3.5,将从纠纷化解知识库中检索出来的文档的相关性得分与从纠纷化解知识向量库中检索出来的文档的相似度得分进行加权平均得到加权平均得分,对于缺少的相关性得分和相似度得分使用0分进行填充;步骤3.6,将文档按照加权平均得分进行降序排列,选择最高的K3个文档,作为输入文档的相关纠纷化解知识;步骤4,将输入问题和检索出来的相关纠纷化解知识按照提示模板生成提示内容,输入大语言模型后,输出回答,具体如下:步骤4.1,将输入问题和检索出来的相关纠纷化解知识按照提示模板生成提示内容;步骤4.2,将提示模板生成的提示内容输入到大语言模型中,得到输出结果;步骤4.3,将输出结果作为输入问题的回答进行返回。

全文数据:

权利要求:

百度查询: 南京视察者智能科技有限公司 一种基于检索增强大语言模型的纠纷化解智能问答系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。