中国航空综合技术研究所卓雨东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国航空综合技术研究所申请的专利基于大模型的航空多领域数据自适应提取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119474344B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411703323.7,技术领域涉及:G06F16/334;该发明授权基于大模型的航空多领域数据自适应提取方法及系统是由卓雨东;何柳;刘俊;王浩东;孙郁文;刘姝妍;裴育;曾江辉;王孝天;王少枫;潘娅云;安然;武铎设计研发完成,并于2024-11-26向国家知识产权局提交的专利申请。
本基于大模型的航空多领域数据自适应提取方法及系统在说明书摘要公布了:本发明提供一种基于大模型的航空多领域数据自适应提取方法及系统,涉及数据检索技术领域,方法包括:获取航空领域多领域数据集并进行预处理得到预处理数据集;基于预处理数据集构建若干个倒排索引表;基于训练好的BGE模型将预处理数据集中各文本的各段落进行语义特征提取,得到语义特征向量库;基于训练好的BGE模型对用户输入的文本进行语义特征提取,得到输入特征向量;基于大模型计算得到余弦相似度集合和语素相似度集合;并将语素相似度集合进行归一化处理,得到归一化值集合;对归一化值集合和余弦相似度集合进行融合排序得到提取结果。本发明将同时将关键词提取和语义提取结果进行融合排序,保证提取的丰富性与排序的准确度。
本发明授权基于大模型的航空多领域数据自适应提取方法及系统在权利要求书中公布了:1.一种基于大模型的航空多领域数据自适应提取方法,其特征在于,其包括:获取航空领域多领域数据集,并对所述航空领域多领域数据集进行预处理,得到预处理数据集;基于所述预处理数据集构建若干个倒排索引表;每个所述倒排索引表对应一个领域;所述倒排索引表包括Json键值对和若干个语素,每个所述语素对应所述预处理数据集中的一个文本;所述Json键值对包括索引名称、索引数据内容和用途;将所述预处理数据集中的若干个文本拆分为句子,并基于大模型对各句子进行划分,得到第一训练集,基于所述第一训练集对BGE模型进行无监督训练,得到初始训练好的所述BGE模型;将所述预处理数据集中的若干个文本的段落作为第二训练集,并基于大模型对所述预处理数据集中的若干个文本的段落进行提问,得到长短文本标注数据集;将所述长短文本标注数据集作为标签集并结合所述第二训练集对初始训练好的所述BGE模型进行有监督训练,得到训练好的所述BGE模型;基于训练好的所述BGE模型将所述预处理数据集中各文本的各段落进行语义特征提取,得到语义特征向量库;基于训练好的所述BGE模型对用户输入的文本进行语义特征提取,得到输入特征向量;基于大模型对所述输入特征向量与所述语义特征向量库中的各语义特征向量进行余弦相似度计算,得到初始余弦相似度集合;基于各所述倒排索引表的Json键值对,采用大模型对用户输入的文本进行分析,得到需求倒排索引表;所述需求倒排索引表为用户输入的文本对应的领域所对应的倒排索引表;基于所述需求倒排索引表中的各语素,采用大模型根据用户输入的文本形成查询语句和所述查询语句中各查询字段的权重;基于大模型和所述查询语句中各查询字段的权重,对所述查询语句与所述需求倒排索引表中的各语素进行相似度计算,得到语素相似度集合;并将所述语素相似度集合进行归一化处理,得到初始归一化值集合;若所述初始归一化值集合中归一化值与所述初始余弦相似度集合中余弦相似度对应所述预处理数据集中同一个文本,将此文本作为当前文本,将当前文本对应的所述归一化值和所述余弦相似度对进行加权求和,得到融合值,并从所述初始余弦相似度集合中删除当前文本所对应的所述余弦相似度,从所述初始归一化值集合中删除当前文本所对应的所述归一化值,遍历所述初始归一化值集合和所述初始余弦相似度集合,得到归一化值集合、余弦相似度集合和融合值集合;所述融合值集合包括若干个所述融合值;对所述融合值集合中各所述融合值、所述归一化值集合中各所述归一化值和所述余弦相似度集合中各所述余弦相似度按照从大到小进行排序并根据需求数量给出对应的文本作为提取结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国航空综合技术研究所,其通讯地址为:100028 北京市朝阳区东直门外京顺路7号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。