【发明授权】一种基于预训练语言模型和白化风格化的简历重构方法_四川大学_202311122400.5

导航：龙图腾网> 最新专利技术> 一种基于预训练语言模型和白化风格化的简历重构方法_四川大学_202311122400.5

申请/专利权人：四川大学

申请日：2023-09-01

公开（公告）日：2024-04-12

公开（公告）号：CN117131845B

主分类号：G06F40/166

分类号：G06F40/166;G06F18/24;G06F18/214;G06F18/10;G06N3/084;G06N3/0455;G06N3/0985

优先权：

专利状态码：有效-授权

法律状态：2024.04.12#授权;2023.12.15#实质审查的生效;2023.11.28#公开

摘要：本发明公开了一种基于预训练语言模型和白化风格化的简历重构方法，包括以下步骤：步骤1：获取简历数据，对数据进行预处理作为训练数据集和测试数据集；步骤2：构建性别分类器和规范化分类器；步骤3：构建简历复述模型并进行训练，简历复述模型以GPT2模型为主体，在靠近输出端的某一层连接用于对重构简历进行白化和风格化的白化‑风格化模块；步骤4：将简历输入步骤3训练完成的简历复述模型，即可得到风格重构简历；本发明构建的复述模型可以对简历进行性别中性化或规范化重写，并且将原始简历内容在词语级别和语义信息层面的多角度约束融入到生成过程中，对简历风格化改写提供依据。

主权项：1.一种基于预训练语言模型和白化风格化的简历重构方法，其特征在于，包括以下步骤：步骤1：获取简历数据，对数据进行预处理作为训练数据集和测试数据集；预处理包括对简历数据进行数据清洗，通过正则表达式去除包含乱码和非法符号的数据；得到简历正文和应聘者性别数据对；步骤2：构建性别分类器和规范化分类器；性别分类器和规范化分类器采用基于GPT模型的分类模型，性别分类器输出简历作者性别，规范化分类器输出规范化标签，其中规范化标签包括规范文本和不规范文本两种；性别分类器和规范化分类器均使用交叉熵损失函数进行模型训练；步骤3：构建简历复述模型并进行训练，简历复述模型以GPT2模型为主体，在GPT2模型输出端连接用于对重构简历进行白化和风格化的白化-风格化模块；白化-风格化模块首先对重构简历进行白化转换，即去除输入表达中的风格信息，生成只包含基本内容信息的文本表示；然后对白化后的文本表示进行风格化恢复；白化转换过程如下：计算潜在表达z的协方差矩阵∑zE[z-zμz-zμT]式中：zμ为z的均值，T表示转置操作，E表示平均值操作；将协方差矩阵与单位矩阵I之间差值的弗罗贝尔乌斯范数最小化：式中：W为白化矩阵，F表示弗罗贝尼乌斯范数；白化变换表示为：c＝Wz式中：z为输入简历的潜在表达，c为白化后的潜在表达；风格化过程如下：代表风格特征的协方差矩阵∑s进行分解：∑s＝UsΛsUsT式中：为特征值对角矩阵，为特征向量矩阵，S为风格化矩阵；风格化矩阵如下：风格化转换如下：式中：为风格化的潜在表示；步骤4：将经过预处理的简历数据输入步骤3训练完成的简历复述模型，即可得到风格重构简历；训练过程中采用的多目标优化函数为将以下目标最小化：式中：x为输入简历，y为重构后的简历；logpy|x为原始简历x的条件概率，fgeny为对于重构简历的性别目标函数，fformaly为对于重构简历的规范化目标函数，fcontx,y为定义在x和y之间的内容函数；其中fgeny采用性别分类器的性别预测概率的负对数；fformaly采用规范化分类器的规范化预测概率的负对数；fcontx,y定义如下：式中：fcont_wordx,y为词语层级约束函数，fcont_sentx,y为句子层级约束函数，γ1和γ2为加权超参数；式中：n为模型构建的字典的大小，xi为原始简历中的词，yj为重构简历中的词，dx、dy分别为原始简历和重构简历中的词个数，Tij为转移矩阵，cxi,yj为词语xi和yj的嵌入表示之间的欧式距离；subjectto表示受约束于；fcont_sentx,y＝cosx,y多目标优化函数求解过程如下：最小化重构误差，同时各个约束的损失低于阈值： fgeny≤μ1,fformaly≤μ2,fcontx,y≤ε1式中：μ1、μ2和ε1均为可调整的超参数；构建拉格朗日函数，然后使用梯度下降来优化拉格朗日乘数和y得到最优解。

全文数据：

权利要求：

百度查询：四川大学一种基于预训练语言模型和白化风格化的简历重构方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：再生废液处理系统_山东荣信集团有限公司_202322260404.1

下一篇：一种人参肽粉研磨设备_上海中盈经济发展(集团)有限公司_202322368406.2

相关技术

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种人参肽粉研磨设备_上海中盈经济发展(集团)有限公司_202322368406.2

配备可拆固定式导纸嘴的打印装置_长城信息股份有限公司_202322616485.4

一种散热户外路灯灯头_中山市澳斯朗电控科技有限公司_202322819842.7

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

一种危废行业可快速更换的水封出渣系统_渤瑞环保股份有限公司_202322016372.0

一种抑菌保暖女式羊绒大衣_安庆初颖数字科技有限公司_202322077610.9

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

白化相关技术

一种基于预训练语言模型和白化风格化的简历重构方法_四川大学_202311122400.5

一种耦合预白化处理的水文时间序列创新趋势识别方法_中国科学院地理科学与资源研究所_202410046113.9

包含丙酮酸钠作为有效成分的美白化妆料组合物_株式会社LG生活健康_202180059291.X

一种基于信息序列的随机性白化增强PUF提取系统_中物院成都科学技术发展中心_202311428553.2

一种低白化抗冲击快干胶组合物及制备方法_上海兰盛新材料科技有限公司_202211376765.6

一种美白活性肽及在美白化妆品中的应用_南京星浩生物科技有限公司_202311862715.3

一种合成革白化检测设备及其使用方法_世联汽车内饰(苏州)有限公司_202111105503.1

一种用于可溶性胶原蛋白化妆品的制备装置_菏泽富贵花簇生物科技有限公司_202322034726.4

噪声白化方法、装置、设备及存储介质_鹏城实验室_202311705527.X

一种基于白化矩阵的双线性池化方法及装置_西安电子科技大学_202311715141.7

风格化相关技术

一种基于生成式对抗网络的音频风格统一的方法_厦门大学_202110351514.1

模块化眼镜_温州市嘉洋眼镜有限公司_202322720615.9

玻璃钢化系统_广东顺德添百利科技股份有限公司_202322321586.9

料盒自动化输送装置及料盒自动化输送系统_广汽乘用车(杭州)有限公司_202322231946.6

一种连续杂化凝胶长丝的陶瓷化设备_东华大学_202210326220.8

一种污泥脱水干化一体化设备_江苏康泰环保股份有限公司_202211272836.8

医学图像数据的可视化_西门子医疗有限公司_202010200043.X

自动化套口上领设备_内蒙古帕阑蒂科技发展有限公司_202322401589.3

样品体积的自数字化_华盛顿大学商业中心_202111601955.9

生成参数化空间音频表示_诺基亚技术有限公司_202311364414.8

模型相关技术

结构识别模型训练、模型结构识别方法、设备及介质_北京燧原智能科技有限公司_202410090059.8

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

用于模型蒸馏的方法和装置_北京百度网讯科技有限公司_202011473804.5

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

一种手板模型用打磨设备_青岛诚品模型有限公司_202322254282.5

基于ARIMA模型的容量预测装置及其控制方法_上海新炬网络信息技术股份有限公司_202010209101.5

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

模型处理方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202011056384.0

利用模型增强的自监督学习_硕动力公司_202280060208.5

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

龙图腾网&IPTOP

【发明授权】一种基于预训练语言模型和白化风格化的简历重构方法_四川大学_202311122400.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务