恭喜浙江实在智能科技有限公司张晶获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江实在智能科技有限公司申请的专利基于检索增强技术的商业地产问答内容生成系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119719314B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510213373.5,技术领域涉及:G06F16/3329;该发明授权基于检索增强技术的商业地产问答内容生成系统是由张晶;徐璐;孙永岗;袁钦源设计研发完成,并于2025-02-26向国家知识产权局提交的专利申请。
本基于检索增强技术的商业地产问答内容生成系统在说明书摘要公布了:本发明属于人工智能技术领域,具体涉及基于检索增强技术的商业地产问答内容生成系统。系统包括原始数据处理模块、文本内容切块模块、知识库构建模块、查询改写模块、问题规划拆解模块、意图路由模块、混合检索模块和内容生成模块。本发明具有更加高效、准确率更高,同时在用户使用体验也有较大提升的特点。
本发明授权基于检索增强技术的商业地产问答内容生成系统在权利要求书中公布了:1.基于检索增强技术的商业地产问答内容生成系统,其特征在于,包括:原始数据处理模块,用于对收集的商业地产领域内的多源异构数据,解析处理成文本内容;文本内容切块模块,用于对解析的文本内容进行切片处理;知识库构建模块,用于将切片处理后的文档,按照相应的文档内容进行归类,再对文档切片进行向量化处理并存入不同的知识库;同时对每个不同知识库的知识内容进行简要描述;查询改写模块,用于将当前的用户输入查询进行指代消歧,并改写成具有清晰明确语义的指令;问题规划拆解模块,用于通过设置合理的提示词模板,引导大模型判断改写后的用户查询是否为复杂任务指令并进行拆解;意图路由模块,用于对拆解后的用户任务指令进行意图识别,获得意图识别结果,并从符合用户意图的知识库中进行检索;混合检索模块,用于在结合语义向量相似与基于统计词频信息的文本匹配方法基础上,通过构建业务关键词库,设计评分规则得到文档的综合相似得分;同时选择相似得分最高的若干个文档切片作为用户查询的相关文档;内容生成模块,用于根据用户输入查询检索得到的相关文档,在考虑用户背景信息的情况下,为用户提供定制化的问题回复与分析建议;所述问题规划拆解模块,具体包括如下过程:若当前改写后的用户查询为简单任务指令,则不做任何修改;若当前改写后的用户查询为复杂任务指令,则从预先构建好的业务逻辑知识图谱中,匹配出与指令相关的若干个业务实体节点和对应实体之间的操作关系,并输入到大模型中;利用大模型的任务拆解与规划能力,最终将原始指令拆解为若干个子任务;根据以往业务总结归纳得到的业务规则地图,综合规划各个子任务的执行逻辑;若根据业务规则地图判断子任务之间存在相互依赖关系,则串行执行各个子任务,否则并行地执行各个子任务;所述意图路由模块,具体包括如下过程:采用人工标注的意图识别训练样本作为种子数据,构造合成数据作为训练集,采用分布式训练框架Deepspeed进行模型微调训练,得到用于对拆解后的用户任务指令进行意图识别的商业地产领域专有意图识别模型;通过商业地产领域专有意图识别模型对用户任务指令进行意图识别,将用户任务指令路由至系统下游的特定内容生成子模块,并从符合用户意图的知识库中进行检索;同时,根据不同的意图识别结果,从内容模板库中选择特定的格式模板供后续的内容生成模块使用;所述混合检索模块,具体包括如下过程:S1,通过业务语料训练出特定的命名实体识别模型,并构建业务关键词库;利用关键词重要性评分模型,为每个关键词赋予相应的权重分数;针对用户查询语句与知识库中文档切片共现的关键词,计算查询语句与知识库中各文档切片的关键词相关分数;业务关键词检索得分等于用户查询输入文本中包含的各个业务关键词得分之和,具体表示为如下公式: 其中,KeywordScore表示关键词重要性评分,q,d分别表示用户的输入查询文本和知识库中的某个切片文档;Setkw表示业务关键词库,ti表示包含在业务关键词库中的用户查询中的词语;Rule·表示基于业务规则提炼得到的关键词重要性评分函数,所述函数满足关键词业务属性越强,输出得分越高;S2,计算基于语义的文本向量嵌入以及基于统计词频信息的文本匹配方法的用户查询与知识库文档切片相似性分数;基于文本嵌入向量的相似性得分计算方法如下: 其中,SimilarityScoreq,d表示用户查询q与切片文档d的相似性得分,Embed·表示用于将切片文档与用户查询的文本描述转换成语义向量的词嵌入模型;‖·‖表示二范数;S3,在构建的业务训练数据上学习得到一组权重系数,按权重将各检索方法得到的文档切片相似分数进行加权相加,得出最终的相似得分FinalScore,并选择得分最高的若干文档切片作为用户查询的相关文档,具体计算方法如下: 其中,BMScoreq,d为用户查询q与切片文档d通过统计词频的文本稀疏向量表示的相似性得分;BMScoremax表示基于统计词频的相似性得分最大值;BMScoremin表示基于统计词频的相似性得分最小值;α1,α2,α3分别为基于文本嵌入的相似性得分、基于统计词频的相似性得分及基于关键词重要性评分的权重系数;KeywordScoremax表示关键词重要性评分的最大值;KeywordScoremin表示关键词重要性评分的最小值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江实在智能科技有限公司,其通讯地址为:310000 浙江省杭州市余杭区余杭街道文一西路1818-2号6幢6层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。