【发明授权】文本处理模型的训练方法、文本处理方法及装置_华为技术有限公司_201910865963.0

导航：龙图腾网> 最新专利技术> 文本处理模型的训练方法、文本处理方法及装置_华为技术有限公司_201910865963.0

申请/专利权人：华为技术有限公司

申请日：2019-09-12

公开（公告）日：2024-04-12

公开（公告）号：CN112487182B

主分类号：G06F16/35

分类号：G06F16/35;G06F18/214;G06F18/241;G06N3/0442;G06N3/0455;G06N3/0464;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.04.12#授权;2021.03.30#实质审查的生效;2021.03.12#公开

摘要：本申请公开了人工智能领域中自然语言处理领域的文本处理模型的训练方法、文本方法以及装置，该训练方法包括：获取训练文本；将该训练文本分别输入老师模型与学生模型，得到该老师模型输出的样本数据与该学生模型输出的预测数据，其中，该老师模型与该学生模型分别包括输入层、一个或者多个中间层以及输出层，该样本数据包括该老师模型的中间层输出的样本语义特征以及输出层输出的样本标签，该预测数据包括该学生模型的中间层输出的预测语义特征以及输出层输出的预测标签；基于该样本数据以及该预测数据训练该学生模型的模型参数，得到目标学生模型。本申请的技术方案使得学生模型有效的进行知识迁移，从而提高学生模型的文本处理结果的准确率。

主权项：1.一种文本处理模型的训练方法，其特征在于，包括：获取训练文本；将所述训练文本分别输入老师模型与学生模型，得到所述老师模型输出的样本数据与所述学生模型输出的预测数据，其中，所述老师模型与所述学生模型分别包括输入层、一个或者多个中间层以及输出层，所述样本数据包括所述老师模型的中间层输出的样本语义特征以及所述老师模型的输出层输出的样本标签，所述预测数据包括所述学生模型的中间层输出的预测语义特征以及所述学生模型的输出层输出的预测标签，所述老师模型为预先训练的用于文本处理的模型；基于所述样本数据以及所述预测数据训练所述学生模型的模型参数，得到目标学生模型；其中，所述老师模型与所述学生模型为转换器Transformer模型，所述老师模型的中间层包含N个Transformer层，所述学生模型的中间层包含M个Transformer层，N为大于或等于M的正整数，所述基于所述样本语义特征与所述预测语义特征，训练所述学生模型的中间层，包括：从所述老师模型包含的N个Transformer层中选择M个Transformer层，所述M个Transformer层中每一个Transformer层包含注意力机制模块和前向网络模块；基于所述老师模型中M个Transformer层的第i个Transformer层输出的样本语义特征以及所述老师模型的第i个Transformer层包含的所述注意力机制模块中的注意力分数矩阵训练所述学生模型的第i个Transformer层，i为小于或等于M的正整数，M为大于或等于1的整数。

全文数据：

权利要求：

百度查询：华为技术有限公司文本处理模型的训练方法、文本处理方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

下一篇：一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

相关技术

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种醋酸酐含量检测装置_山东嘉驰新材料股份有限公司_202322220520.0

一种高效散热电源_广州市力为电子有限公司_202322175013.X

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

CNC加工用快速换线治具_东莞华清光学科技有限公司_202322418777.7

一种尺寸可调节的中药材切片装置_安徽盛林国药饮片有限公司_202322230535.5

一种醋酸钠生产用搅拌装置_安徽海逸生物科技有限公司_202322412726.3

一种具有服药求助警报功能的药丸储存项链_杨洁_202322091839.8

龙图腾网&IPTOP

【发明授权】文本处理模型的训练方法、文本处理方法及装置_华为技术有限公司_201910865963.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务