【发明公布】一种基于字典树的生成式神经网络模型的预训练方法_刘凡平_202310524785.1

导航：龙图腾网> 最新专利技术> 一种基于字典树的生成式神经网络模型的预训练方法_刘凡平_202310524785.1

申请/专利权人：刘凡平

申请日：2023-05-10

公开（公告）日：2024-04-16

公开（公告）号：CN117891893A

主分类号：G06F16/31

分类号：G06F16/31;G06N3/04;G06N3/08

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.03#实质审查的生效;2024.04.16#公开

摘要：本发明提供了一种基于字典树的生成式神经网络模型的预训练方法，包括如下方法步骤：S1、获取原始数据，建立字典树，其中，字典树包括N层结构，N≥2；S2、抽取字典树的第K层的数据，输入生成式神经网络模型的输入层对生成式神经网络模型进行预训练，K＝1、2、…、N‑1；其中，生成式神经网络模型预训练过程中采用二元交叉熵损失函数更新参数；S3、抽取字典树的第K+1层的数据，输入预训练好的生成式神经网络模型，对字典树的第K+1层的数据进行预测。本发明采用层次化的训练，提升数据采样的效率，提升生成式神经网络模型的收敛速度、降低不同词语对下一个词语预测的干扰。

主权项：1.一种基于字典树的生成式神经网络模型的预训练方法，其特征在于，所述预训练方法包括如下方法步骤：S1、获取原始数据，建立字典树，其中，所述字典树包括N层结构，N≥2；S2、抽取所述字典树的第K层的数据，输入生成式神经网络模型的输入层对生成式神经网络模型进行预训练，K＝1、2、…、N-1；其中，生成式神经网络模型预训练过程中采用二元交叉熵损失函数更新参数；S3、抽取所述字典树的第K+1层的数据，输入预训练好的生成式神经网络模型，对所述字典树的第K+1层的数据进行预测。

全文数据：

权利要求：

百度查询：刘凡平一种基于字典树的生成式神经网络模型的预训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种产丙酸的工程益生菌的构建与应用_天津大学_202310196065.7

下一篇：一种基于计算机视觉的肺区区域分割系统_东莞理工学院_202210022595.5

相关技术

一种产丙酸的工程益生菌的构建与应用_天津大学_202310196065.7

一种基于计算机视觉的肺区区域分割系统_东莞理工学院_202210022595.5

一种基于Flink流处理的地铁轨道几何检测数据清洗方法_成都国铁电气设备有限公司_202210023454.5

一种乘用车极限强度冲击试验平台辅助装置_中汽研汽车试验场股份有限公司_201911236112.6

基于数字镜像的变电站自动化设备状态诊断方法和系统_北京四方继保工程技术有限公司_202210022507.1

一种全自动样品混合缩分装置及方法_青岛海关技术中心_201910859073.9

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

一种富氦气藏区带的评价方法、装置、设备及介质_中国石油天然气股份有限公司_202311208279.8

一种基于准零刚度原理的空气悬架及其结构设计与优化方法_江苏大学_202111438418.7

一种基于数字孪生的加工过程自适应控制方法_东华大学_202111238057.1

聚离子弹性体及其制备方法与应用_赛感科技(深圳)有限公司_202211412739.4

一种用于开槽埋管的冷冻施工辅助设备及方法_长江生态环保集团有限公司_202310118173.2

龙图腾网&IPTOP

【发明公布】一种基于字典树的生成式神经网络模型的预训练方法_刘凡平_202310524785.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务