【发明公布】一种用于探测预训练深度语言模型生成的句子表示的方法_桂林电子科技大学_202311397452.3

申请/专利权人：桂林电子科技大学

申请日：2023-10-26

公开（公告）日：2024-03-05

公开（公告）号：CN117648922A

主分类号：G06F40/211

分类号：G06F40/211;G06F16/35;G06N3/04;G06N3/0895

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.03.22#实质审查的生效;2024.03.05#公开

摘要：本发明涉及语言处理技术领域，涉及一种用于探测预训练深度语言模型生成的句子表示的方法，包括：一、给定句子W、W对应的模型M；二、从模型M中获得向量序列H＝MW；三、设计树拓扑探针，树拓扑探针首先使用结构探针计算H的探测树深序列probSeqf；然后，构建伪树深序列pesuSeqW并计算pesuSeqf与pesuSeqW之间的距离度量；四、将任务损失和距离度量输入综合损失得到最后的微调损失，通过树拓扑探针微调发现预训练深度语言模型生成的句子表示的内部结构是否具有树形结构的层次结构。本发明能较佳地探测句子表示。

主权项：1.一种用于探测预训练深度语言模型生成的句子表示的方法，其特征在于：包括以下步骤：一、给定句子W、W对应的模型M；二、从模型M中获得向量序列H＝MW；三、设计树拓扑探针，树拓扑探针首先使用结构探针计算H的探测树深序列probSeqf；然后，构建伪树深序列pesuSeqW并计算probSeqf与pesuSeqW之间的距离度量DistanceMetric；四、将任务损失和距离度量DistanceMetric输入综合损失CombinedLoss得到最后的微调损失，通过树拓扑探针微调发现预训练深度语言模型生成的句子表示的内部结构是否具有树形结构的层次结构。

全文数据：

权利要求：

百度查询：桂林电子科技大学一种用于探测预训练深度语言模型生成的句子表示的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：再生废液处理系统_山东荣信集团有限公司_202322260404.1

下一篇：一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

相关技术

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种散热户外路灯灯头_中山市澳斯朗电控科技有限公司_202322819842.7

一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种不锈钢带输送机构_佛山市南海区东励森金属制品有限公司_202322463638.6

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

龙图腾网&IPTOP

【发明公布】一种用于探测预训练深度语言模型生成的句子表示的方法_桂林电子科技大学_202311397452.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务