【发明授权】一种自然语言推理微调方法、系统、装置及存储介质_华南理工大学_202210179894.X

导航：龙图腾网> 最新专利技术> 一种自然语言推理微调方法、系统、装置及存储介质_华南理工大学_202210179894.X

申请/专利权人：华南理工大学

申请日：2022-02-25

公开（公告）日：2024-04-23

公开（公告）号：CN114626529B

主分类号：G06N5/04

分类号：G06N5/04;G06F40/211;G06F40/30;G06N3/0455;G06N3/0442;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.04.23#授权;2022.07.01#实质审查的生效;2022.06.14#公开

摘要：本发明公开了一种自然语言推理微调方法、系统、装置及存储介质，其中方法包括：获取前提文本与假设文本，对前提文本与假设文本进行分词，获得文本的离散编码；将离散编码输入预训练模型中进行句向量建模，获得隐藏向量；将隐藏向量拆分为前提隐藏向量和假设隐藏向量；将前提隐藏向量的句首向量输入到推理模块进行推理任务，并获取第一损失；将前提隐藏向量输入到文本生成模块进行生成任务，并获取第二损失；将第一损失和第二损失进行相加，根据相加获得的损失优化预训练模型、推理模块以及文本生成模块。本发明能够充分学习句子间的语义相关性，在原本的推理任务中取得更好的效果。本发明可广泛应用于自然语言推理技术领域。

主权项：1.一种自然语言推理微调方法，其特征在于，包括以下步骤：获取前提文本与假设文本，对前提文本与假设文本进行分词，获得文本的离散编码；将离散编码输入预训练模型中进行句向量建模，获得隐藏向量；将隐藏向量拆分为前提隐藏向量和假设隐藏向量；将前提隐藏向量的句首向量输入到推理模块进行推理任务，并获取第一损失；将前提隐藏向量输入到文本生成模块进行生成任务，并获取第二损失；将第一损失和第二损失进行相加，根据相加获得的损失优化预训练模型、推理模块以及文本生成模块；所述对前提文本与假设文本进行分词，获得文本的离散编码，包括：将前提文本表示为其中m为前提文本的长度；将假设文本表示为其中n为假设文本的长度；将前提文本与假设文本连接起来作为联合文本，联合文本表示为其中，句首的CLS作为句向量表示词，句中SEP作为句子对的分割词，以及文本的结尾；将联合文本输入到分词器得到文本的离散编码；所述将离散编码输入预训练模型中进行句向量建模，获得隐藏向量，包括：将文本的离散编码输入到预训练模型BERT中，经过编码后获得隐藏向量，隐藏向量表示为所述将隐藏向量拆分为前提隐藏向量和假设隐藏向量，包括：将隐藏向量进行拆分得到前提隐藏向量和假设隐藏向量如下：前提隐藏向量：假设隐藏向量：所述将前提隐藏向量的句首向量输入到推理模块进行推理任务，并获取第一损失，包括：将前提隐藏向量中的句首向量hCLs，输入到推理模块的MLP网络中，并根据分类器获取样本预测类的概率分布，获取最大的概率作为预测类别；将预测类别和预设的标签进行交叉熵损失计算，得到推理任务的第一损失；所述将前提隐藏向量输入到文本生成模块进行生成任务，并获取第二损失，包括：将前提隐藏向量以及样本的标签嵌入输入到BiLSTM网络中，其中，前提隐藏向量中的每个向量作为BiLSTM网络每一个时间步的输入；获取每一个时间步生成的单词的概率分布，选取最高概率的单词作为输出单词，生成句子；将生成的句子和原本样例的假设文本进行交叉熵损失计算，得到生成任务的第二损失所述生成任务中采用到的标签根据推理任务是三分类还是二分类进行自适应地选择；标签信息通过标签嵌入矩阵得到标签嵌入向量，作为文本生成模块中BiLSTM网络的起始输入向量，表明当前生成的假设文本和前提文本之间的蕴含关系，从而指导BiLSTM网络进行生成；利用Softmax函数计算每一步生成的单词概率分布，选择最高的概率的单词作为最终生成的单词。

全文数据：

权利要求：

百度查询：华南理工大学一种自然语言推理微调方法、系统、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

下一篇：高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

相关技术

一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

一种钝化复合功能层和TOPCon电池_中环新能(安徽)先进电池制造有限公司_202322011797.2

一种玉米种植用病虫害防治装置_黄金双_202322446508.1

一种盒式包装机输送机构_安徽从仁堂生物科技有限公司_202322459283.3

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种塑粉加工压制成型一体化生产设备_常州伟冠塑粉制造有限公司_202322584095.3

一种液压锁密闭性测试装置_靖江市长源液压机械有限公司_202322518953.4

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种高精度智能浊度检测装置_江苏奥坤仪表科技有限公司_202322546638.2

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

方法相关技术

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202010617172.9

通信方法及装置_华为技术有限公司_202211296381.3

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

信息处理方法_丰田自动车株式会社_202311358127.6

通信方法及装置_华为技术有限公司_202311024020.8

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

冰箱及其控制方法_LG电子株式会社_202080061858.2

系统相关技术

显示系统_华为技术有限公司_202110898215.X

破碎系统_内蒙古金辉稀矿有限公司_202322202710.X

空调系统_宁波奥克斯电气股份有限公司_202322434517.9

开采系统_地下萃取技术私人有限公司_201980058102.X

供热系统_瑞纳智能设备股份有限公司_202322452572.0

热泵系统_青岛海尔空调电子有限公司_202211295395.3

EGR系统_赛力斯集团股份有限公司_202211341129.X

液压系统的过滤方法、液压系统及作业机械_三一重机有限公司_202110610891.2

叉车车载电源系统和叉车充电系统_深圳市雄韬锂电有限公司_201911407557.6

用于协助用户配置照明系统的系统及方法_昕诺飞控股有限公司_202080041251.8

微调相关技术

一种自然语言推理微调方法、系统、装置及存储介质_华南理工大学_202210179894.X

基于指令微调和检索增强生成的在线智能问答方法及装置_杭州有赞科技有限公司_202410118530.X

一种模切刀具微调自动定位装置_深圳市福泉兴模切刀具科技有限公司_202322244565.1

方便微调的电视机支架精密冲压模具_深圳市润恒泰实业有限公司_202321789035.9

一种用于DMD数字微镜阵列的便捷焦面微调装置_苏州迈科芯纳智能科技有限公司_202322538726.8

基于学习权重向量的大模型微调方法、装置、设备及介质_厦门蝉羽网络科技有限公司_202410177508.2

一种色选机相机的微调校正结构_安徽捷迅光电技术有限公司_202410236539.0

基于预训练语言模型提示微调的开放知识图谱补全方法、装置_中国人民解放军国防科技大学_202410041466.X

一种动目标轨迹拐角平缓微调的平滑优化方法和系统_中微智创(北京)软件技术有限公司_202311297795.2

一种用于生产SMD晶体谐振器的微调盘_无锡神山科技有限公司_202322354930.4

龙图腾网&IPTOP

【发明授权】一种自然语言推理微调方法、系统、装置及存储介质_华南理工大学_202210179894.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务