买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于自然语言的数据查询方法、装置及翻译模型_北京安博通科技股份有限公司_202011215342.7 

申请/专利权人:北京安博通科技股份有限公司

申请日:2020-11-04

公开(公告)日:2024-04-16

公开(公告)号:CN112182022B

主分类号:G06F16/242

分类号:G06F16/242;G06F16/2452;G06F16/2453;G06F16/2455

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2021.01.22#实质审查的生效;2021.01.05#公开

摘要:本申请实施例公开了基于自然语言的数据查询方法、装置及翻译模型,该方法包括将用户输入的自然语言查询语句,输入至预先构建的翻译模型中,通过该翻译模型从自然语言查询语句中提取出拟查询字段及拟条件字段,并从预设的表字段中筛选出与拟查询字段距离最近的字段作为最终查询字段,以及从表字段中筛选出与拟条件字段距离最近的字段作为最终条件字段,将最终查询字段及最终条件字段拼接成SQL查询语句;根据翻译模型输出的SQL查询语句进行数据查询。上述方法通过提取拟查询字段及拟条件字段,识别出自然语言查询语句与翻译模型中预存的语言存在差异的字段,并对这些字段进行修正以进行后续的数据查询,能够有效防止出现无法查询的现象。

主权项:1.一种基于自然语言的数据查询方法,其特征在于,所述数据查询方法包括:获取用户输入的自然语言查询语句;将所述自然语言查询语句输入至预先构建的翻译模型中,所述翻译模型用于从所述自然语言查询语句中提取出拟查询字段及拟条件字段,并从预设的表字段中筛选出与所述拟查询字段距离最近的字段作为最终查询字段,以及从所述表字段中筛选出与所述拟条件字段距离最近的字段作为最终条件字段,最后将所述最终查询字段及所述最终条件字段拼接成SQL查询语句,其中,所述拟查询字段及所述拟条件字段均不属于所述表字段中的任意字段;根据所述翻译模型输出的SQL查询语句进行数据查询;所述翻译模型用于通过以下操作,从所述自然语言查询语句中提取出拟查询字段及拟条件字段:对所述自然语言查询语句中每个字段进行向量编码,获取对应的字段向量序列;对所述字段向量序列中的每个字段向量进行类型标注,其中,所述类型标注包括有效标注和无效标注,所述有效标注包括条件标注、操作符标注、条件值标注及查询字段标注;将所述查询字段标注对应的字段设为所述拟查询字段,将所述条件标注对应的字段设为所述拟条件字段;所述对所述字段向量序列中的每个字段向量进行类型标注,包括:将所述字段向量序列中的每个字段向量输入至预设的CRF矩阵中,所述CRF矩阵中预设有多种字段类型;针对任一字段向量,获取所述CRF矩阵输出的所有字段类型的概率值,并根据概率值最大的字段类型,对该字段向量进行类型标注;针对类型标注为有效标注且类型标注结果相同的多个字段向量,分别在它们的类型标注结果后面添加后缀标识符,所述后缀标识符为起始标识符或后续标识符;根据所述起始标识符及所述后续标识符,将所述类型标注为有效标注且类型标注结果相同的多个字段向量进行拼接,得到该类型标注对应的字段。

全文数据:

权利要求:

百度查询: 北京安博通科技股份有限公司 基于自然语言的数据查询方法、装置及翻译模型

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。