【发明公布】一种基于大规模语言模型和预训练微调机制的跨领域方面术语抽取方法_山西财经大学_202410115899.5

申请/专利权人：山西财经大学

申请日：2024-01-29

公开（公告）日：2024-04-26

公开（公告）号：CN117933255A

主分类号：G06F40/295

分类号：G06F40/295;G06F16/35;G06N3/0442;G06N3/045

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.14#实质审查的生效;2024.04.26#公开

摘要：本发明公开了一种基于大规模语言模型和预训练微调机制的跨领域方面术语抽取方法。在跨领域方面术语抽取任务中，针对特定领域标记级标签数据的稀缺性，提出了一种基于大规模语言模型和预训练微调机制的跨领域方面术语抽取方法。本发明首先使用源领域和目标领域的未标记数据微调大规模预训练语言模型；其次，基于微调后的大规模语言模型构建方面术语抽取模型；最后，在源领域上预训练模型，并使用目标领域的标注数据微调此模型。实验结果表明，本发明提出的方法优于基线模型，有效提高了跨领域方面术语抽取的准确率。

主权项：1.一种基于大规模语言模型和预训练微调机制的跨领域方面术语抽取方法，其特征在于，包括以下步骤：S1，基于大规模语言模型和预训练微调机制的跨领域方面术语抽取方法总体框架；该框架主要包括三个阶段：大规模预训练语言模型的微调阶段、基于大规模语言模型的方面术语抽取模型的构建阶段和特定领域的预训练微调阶段；S2，微调大规模预训练语言模型；引入大规模语言预训练模型BERT，通过掩码预测任务使用源领域和目标领域的未标记数据对BERT模型进行微调，形成适应源领域和目标领域数据的BERT模型；S3，构建基于大规模语言模型的方面术语抽取模型；将基于步骤S2微调后的大规模语言模型与双向长短期记忆网络Bi-directionallongshort-termmemory，Bi-LSTM和条件随机场Conditionalrandomfiled，CRF结合，以构建方面术语抽取模型，该模型包括BERT层、Bi-LSTM层、线性层和CRF层；对构建的方面术语模型进行进一步训练和预测；S4，针对特定领域模型进行预训练和微调，针对步骤S3构建的方面术语抽取模型，首先，在源领域上使用带标签数据预训练模型；然后，在微调过程中引入领域适应损失函数，并使用目标领域带标签数据进一步微调模型。

全文数据：

权利要求：

百度查询：山西财经大学一种基于大规模语言模型和预训练微调机制的跨领域方面术语抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种燃气-蒸汽联合循环发电供热系统_西安热工研究院有限公司_202410130737.9

下一篇：CPR辅助按压器_重庆心搏康医疗科技有限公司_202311753834.5

相关技术

一种燃气-蒸汽联合循环发电供热系统_西安热工研究院有限公司_202410130737.9

CPR辅助按压器_重庆心搏康医疗科技有限公司_202311753834.5

一种助力外骨骼辅助运动装置_中国人民解放军总医院第四医学中心_202311762144.6

一种电能表故障数据监测系统及数据存储介质_中电装备山东电子有限公司_202410411878.8

一种处理安全漏洞的方法及装置、系统、计算机程序产品_上海商米科技集团股份有限公司_202410155802.3

一种双频段相控阵雷达智能抗干扰方法_成都金武科技有限公司_202410410853.6

全氟异丁腈的合成方法_天津市长芦化工新材料有限公司_202410424719.1

混合动力自动手动变速器_伊顿康明斯自动传输技术有限责任公司_202280063792.X

保护开关设备和方法_西门子股份公司_202280065501.0

一种脑膜炎球菌发酵培养基及其制备方法和应用_成大生物(本溪)有限公司_202410343870.2

一种用于降解餐厨垃圾的诱变菌株的复配及其应用_北京林业大学_202410173755.5

一种新型射灯天线_摩比天线技术(深圳)有限公司_202410125372.0

龙图腾网&IPTOP

【发明公布】一种基于大规模语言模型和预训练微调机制的跨领域方面术语抽取方法_山西财经大学_202410115899.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务