【发明公布】句法语言模型的无监督训练方法及装置_支付宝(杭州)信息技术有限公司;上海科技大学_202410296243.8

申请/专利权人：支付宝(杭州)信息技术有限公司;上海科技大学

申请日：2024-03-14

公开（公告）日：2024-05-10

公开（公告）号：CN118014046A

主分类号：G06N3/088

分类号：G06N3/088;G06N3/045;G06F16/35;G06F40/211;G06F40/30

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.28#实质审查的生效;2024.05.10#公开

摘要：本说明书实施例提供一种句法语言模型的无监督训练方法及装置，在训练方法中，首先将输入文本输入组合模型进行句法推导，得到最佳句法树。之后，可以对该最佳句法树进行全部层级的遍历，得到文本片段序列。接着可以将文本片段序列中各文本片段的内部表征一起输入生成模型，得到针对各文本片段预测的各动作类别。最后，可以分别基于生成模型输出的动作类别和基于组合模型确定的各文本片段的外部表征，计算第一预测损失和第二预测损失，并基于第一预测损失和第二预测损失的综合损失，调整组合模型和生成模型的参数。

主权项：1.一种句法语言模型的无监督训练方法，所述句法语言模型包括：生成模型和组合模型；所述方法包括：将第一文本输入所述组合模型进行句法推导，得到当前最佳句法树，其中的每个节点代表一个文本片段，并具有相应的内部表征和外部表征；父节点代表的文本片段是语义切分得到的两个子节点代表的文本片段的组合；所述内部表征通过对对应文本片段的内部信息进行编码得到；所述外部表征通过结合对应文本片段的上下文信息进行编码得到；对所述当前最佳句法树进行全部层级的遍历，得到文本片段序列；将所述文本片段序列中各文本片段的内部表征一起输入所述生成模型，得到针对所述各文本片段预测的各动作类别；所述动作类别选自组合和生成；至少根据所述各动作类别以及动作标签序列，确定第一预测损失；所述动作标签序列基于所述各文本片段的起止位置而确定；根据所述第一预测损失和第二预测损失的综合损失，调整所述生成模型和组合模型的参数；所述第二预测损失基于所述第一文本中各个词的外部表征计算得到。

全文数据：

权利要求：

百度查询：支付宝(杭州)信息技术有限公司;上海科技大学句法语言模型的无监督训练方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于分布式驱动车辆的整车能量流分析方法_吉林大学_202410246674.3

下一篇：一种安全经济型热力管道安装方法_北京建工路桥集团有限公司_202410078965.6

相关技术

一种用于分布式驱动车辆的整车能量流分析方法_吉林大学_202410246674.3

一种安全经济型热力管道安装方法_北京建工路桥集团有限公司_202410078965.6

一种拱桥局部损伤实时监测系统与检测方法_重庆交通大学_202410251684.6

一种建筑电气设备智能节能控制管理系统_山西省城乡规划设计研究院有限公司_202410128068.1

设定判决线的方法、装置、设备及存储介质_深圳市时创意电子股份有限公司_202410273797.6

一种生态智能水闸及水闸的控制方法_河北省廊坊水文勘测研究中心(河北省廊坊水平衡测试中心)_202410174123.0

卷芯结构、电池及卷芯结构的制造方法_合肥国轩高科动力能源有限公司_202410337748.4

基于MBD模型的航空发动机控制软件失效处理自动化检查方法_南京航空航天大学_202410249750.6

一种气动热环保厕具、安装方法及其应用_中国航天空气动力技术研究院_201910351820.8

一种用于助熔剂法生长氮化物单晶的晶体生长设备_山东大学_202410103462.X

富硒蛹虫草多糖SeCMP2、制备方法及其促进成骨细胞增殖的应用_广东粤微食用菌技术有限公司_202410179817.3

一种以关节舒适为导向的数字化口腔种植修复治疗方法_苏州云睿瓷牙科技术有限公司_202410238392.9

相关技术

相关技术

相关技术

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】句法语言模型的无监督训练方法及装置_支付宝(杭州)信息技术有限公司;上海科技大学_202410296243.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务