【发明公布】一种基于注意力机制与BiLSTM的中文查询表格选取方法_浙江大学计算机创新技术研究院_202311547173.0

申请/专利权人：浙江大学计算机创新技术研究院

申请日：2023-11-20

公开（公告）日：2024-03-22

公开（公告）号：CN117743363A

主分类号：G06F16/242

分类号：G06F16/242;G06F16/35;G06F40/289;G06F40/30;G06N3/0442;G06N3/08

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本发明公开了一种基于注意力机制与BiLSTM的中文查询表格选取方法。方法包括：接收中文查询文本以及待查询的数据库连接方式，连接待查询数据库，解析获得数据库表结构，进行拼接获得长序列文本；使用垂直场景语料微调预训练语言模型，将长序列文本输入，进行分词标注与表征编码后输出序列编码；进行池化操作后获得表和列级别表征信息；使用注意力机制将列信息注入表信息中；使用分类器进行表格的分类召回，实现中文查询的表格选取。本发明方法实现了对多表数仓环境下复杂中文查询的表格召回，提升了数据库表格召回的精准度，可有效提高Text2SQL模型的泛化能力，减少语言模型Token长度带来的限制，可以得到良好的查询结果。

主权项：1.一种基于注意力机制与BiLSTM的中文查询表格选取方法，其特征在于，包括：步骤1：接收用户的中文查询文本以及待查询的数据库连接方式，使用接收的待查询的数据库连接方式连接待查询数据库，并进行解析获得数据库表结构，将中文查询文本和数据库表结构进行拼接后获得一条长序列文本；步骤2：使用垂直场景语料微调预训练语言模型，将长序列文本输入微调后的预训练语言模型中，预训练语言模型进行分词标注与表征编码后输出长序列文本的序列编码；步骤3：将序列编码进行池化操作后获得表级别表征信息和列级别表征信息；步骤4：使用注意力机制将列级别表征信息注入表级别表征信息中，获得增强后的表级别表征信息；步骤5：使用分类器对增强后的表级别表征信息进行表格的分类召回，实现中文查询的表格选取。

全文数据：

权利要求：

百度查询：浙江大学计算机创新技术研究院一种基于注意力机制与BiLSTM的中文查询表格选取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

下一篇：一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

相关技术

一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

一种旋转式防撞护栏和混凝土护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419697.3

一种叠瓦电池片检测用工装_江苏龙恒新能源有限公司_202322351795.8

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

一种防堵污水管道_浩卓泵业(杭州)有限公司_202322092893.4

一种钝化复合功能层和TOPCon电池_中环新能(安徽)先进电池制造有限公司_202322011797.2

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

龙图腾网&IPTOP

【发明公布】一种基于注意力机制与BiLSTM的中文查询表格选取方法_浙江大学计算机创新技术研究院_202311547173.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务