【发明公布】一种基于数据增强和大语言模型的语言转化方法和装置_北京启明星辰信息安全技术有限公司;北京网御星云信息技术有限公司_202410065536.5

申请/专利权人：北京启明星辰信息安全技术有限公司;北京网御星云信息技术有限公司

申请日：2024-01-17

公开（公告）日：2024-04-26

公开（公告）号：CN117931841A

主分类号：G06F16/242

分类号：G06F16/242;G06F16/2455;G06F40/295;G06F40/30

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.14#实质审查的生效;2024.04.26#公开

摘要：一种基于数据增强和大语言模型的语言转化装置和方法，该方法利用数据增强技术提高训练数据的数量、多样性和质量；为了提升模型预测的效果，将Text‑To‑SQL任务进行步骤的拆分，并使用大模型对每个步骤逐个加以解决，从而得到自然语言对应的SQL查询语句。该方法具有针对不同阶段进行针对性的优化、模型泛化能力强等优点，特别适合Text‑To‑SQL的应用落地。

主权项：1.一种基于数据增强和大语言模型的语言转化方法，包括以下步骤：S1，数据增强：基于初步构建的SQL查询语句模板和对应text文本模板，根据数据库的schema及文本的语义表示向量特征，扩充得到更多的Text-To-SQL训练语料，将训练语料库分为训练集和验证集；S2，对Text-To-SQL模型进行训练的过程中，找出验证集中预测错误率较高的模板，并按照步骤S1的逻辑，基于这些模板生成多个Text-To-SQL的样本，将这些样本用于模型的继续训练，以得到最终的模型；S3，在预测阶段，通过合并的方式得到输入给大模型的prompt，其中包括以下部分：利用text的语义表示向量，寻找到较为相似的列及其对应表作为第一部分prompt；对text进行命名实体识别，将text中包含的列及其对应表作为第二部分prompt；将text文本与不同列及其枚举值构成的文本进行相似度匹配，找出较为相似的若干列作为第三部分prompt；S4，将预测得到的SQL用于执行。

全文数据：

权利要求：

百度查询：北京启明星辰信息安全技术有限公司;北京网御星云信息技术有限公司一种基于数据增强和大语言模型的语言转化方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：刷新注册的容错处理方法、装置、CSCF以及介质_中国电信股份有限公司_202010967419.X

下一篇：用于运行机动车的方法、调节装置和机动车_奥迪股份公司_202110617439.9

相关技术

刷新注册的容错处理方法、装置、CSCF以及介质_中国电信股份有限公司_202010967419.X

用于运行机动车的方法、调节装置和机动车_奥迪股份公司_202110617439.9

车载电动轮椅装载装置_洛阳和合电子科技有限公司_202111539605.4

双电源双炉体切换开关的自动化控制系统_苏州振湖电炉有限公司_202111432710.8

一种带角度弹性垫圈的热处理方法及热处理装置_贵州航天精工制造有限公司_202111464284.6

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

一种多功能模块化农村生活污水处理设备及处理方法_江苏大学_202211232661.8

一种对文言文中缺失文字的补全方法_丁杨_202311025114.7

一种富氦气藏区带的评价方法、装置、设备及介质_中国石油天然气股份有限公司_202311208279.8

一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

具有高吞吐量的多反射质谱仪_莱克公司_202011284023.1

一种弱监督云检测方法_安徽大学_202310764234.2

龙图腾网&IPTOP

【发明公布】一种基于数据增强和大语言模型的语言转化方法和装置_北京启明星辰信息安全技术有限公司;北京网御星云信息技术有限公司_202410065536.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务