买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】多表Text2sql模型训练方法、系统、装置和介质_平安科技(深圳)有限公司_202210416046.6 

申请/专利权人:平安科技(深圳)有限公司

申请日:2022-04-20

公开(公告)日:2024-04-05

公开(公告)号:CN114817295B

主分类号:G06F16/242

分类号:G06F16/242;G06F16/28;G06F18/214

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2022.08.16#实质审查的生效;2022.07.29#公开

摘要:本发明公开了一种多表Text2sql模型训练方法、系统、装置和介质,可应用于人工智能技术领域。本发明方法通过第一自然语句和第一自然语句对应的第一标签SQL语句,对单表Text2sql模型进行训练后,得到训练好的单表Text2sql模型,接着基于迁移学习方式将训练好的单表Text2sql模型的参数转移到多表Text2sql模型,然后通过第二自然语句和第二自然语句对应的第二SQL语句,对参数迁移后的多表Text2sql模型进行训练,使得多表Text2sql模型可以在单表Text2sql模型的参数基础上实现快速的训练收敛,使多表Text2sql模型能够进一步提高查询多表数据时的语句转换准确率。

主权项:1.一种多表Text2sql模型训练方法,其特征在于,包括以下步骤:获取第一训练数据集;所述第一训练数据集包括第一自然语句和所述第一自然语句对应的第一标签SQL语句;所述第一自然语句用于获取数据库中单个表格的第一目标数据;所述第一标签SQL语句用于查询并返回所述第一目标数据;根据所述第一训练数据集对单表Text2sql模型进行训练,得到训练好的单表Text2sql模型;通过迁移学习方式,将训练好的单表Text2sql模型的参数转移到多表Text2sql模型;获取第二训练数据集;所述第二训练数据集包括第二自然语句和所述第二自然语句对应的第二标签SQL语句;所述第二自然语句用于获取数据库中多个表格的第二目标数据;所述第二标签SQL语句用于查询并返回所述第二目标数据;根据所述第二训练数据集对参数迁移后的多表Text2sql模型进行训练,得到训练好的多表Text2sql模型;其中,所述通过迁移学习方式,将训练好的单表Text2sql模型的参数转移到多表Text2sql模型,包括:获取训练好的所述单表Text2sql模型的第一模型参数;将所述第一模型参数配置到所述多表Text2sql模型中的目标单元,所述目标单元和所述单表Text2sql模型的架构相同;所述单表Text2sql模型包括第一语义分析层和第一分类输出层;所述第一语义分析层与所述第一分类输出层连接;所述根据所述第一训练数据集对单表Text2sql模型进行训练,包括:将所述第一自然语句输入到所述第一语义分析层,得到第一特征数据;将所述第一特征数据输入到所述第一分类输出层,得到第一预测SQL语句;所述第一预测SQL语句用于查询并返回数据库中单个表格的数据;根据所述第一标签SQL语句和所述第一预测SQL语句,调整所述单表Text2sql模型的参数;所述第一分类输出层包括第一预设个数的第一线性归一化层,每一个所述第一线性归一化层的输出结果用于查询所述第一目标数据在所述单个表格中的一个维度的属性特征。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 多表Text2sql模型训练方法、系统、装置和介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。