【发明授权】基于学习权重向量的大模型微调方法、装置、设备及介质_厦门蝉羽网络科技有限公司_202410177508.2

申请/专利权人：厦门蝉羽网络科技有限公司

申请日：2024-02-08

公开（公告）日：2024-04-16

公开（公告）号：CN117725844B

主分类号：G06F30/27

分类号：G06F30/27;G06N3/0499;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2024.04.05#实质审查的生效;2024.03.19#公开

摘要：本发明提供了基于学习权重向量的大模型微调方法、装置、设备及介质，涉及深度学习的大模型技术领域，方法包括：获取待调整的大模型的Transformer模块，所述Transformer模块的核心为自注意力机制；当需要对所述大模型进行微调时，对所述Transformer模块中的k矩阵增加一个可学习的权重向量，对所述Transformer模块中的v矩阵增加一个可学习的权重向量，并经过所述自注意力机制进行处理；在所述自注意力机制处理完毕后，在Transformer模块中增加一个可学习的权重向量lff，输出经过线性层，并根据经过线性层的输出数据获得需要调整的参数量；根据训练样本以及需要调整的参数量对所述大模型进行微调。旨在解决现有微调算法无法与微调基线相匹配，从而在效率和模型质量之间产生了权衡的问题。

主权项：1.一种基于学习权重向量的大模型微调方法,其特征在于，包括：获取物品的数据信息、以及待调整的大模型的Transformer模块，其中，所述Transformer模块的核心为自注意力机制；当需要对所述大模型进行微调时，对所述Transformer模块中的k矩阵增加一个可学习的权重向量，对所述Transformer模块中的v矩阵增加一个可学习的权重向量，并经过所述自注意力机制进行处理，具体为：获取预设的所需向量维度train_dim，根据所述所需向量维度train_dim分别对所述权重向量和权重向量进行定义，其中，所述所需向量维度train_dim与所述自注意力机制中的矩阵维度相对应；将所述权重向量和权重向量初始化为零；在k矩阵中增加所述权重向量时，将所述权重向量与所述k矩阵的矩阵元素对应进行相乘，根据当前所述Transformer模块的输入特征x和缩放系数multiplier对所述Transformer模块的输出特征y进行重新赋值，赋值公式为：y=x1+weightmultiplier，其中，weight为所述权重向量，multiplier为缩放系数，默认赋值为1.0；在v矩阵中增加所述权重向量时，将所述权重向量与所述v矩阵的矩阵元素对应进行相乘，根据当前所述Transformer模块的输入特征x和缩放系数multiplier对所述Transformer模块的输出特征y进行重新赋值，赋值公式为：y=x1+weightmultiplier，其中，weight为所述权重向量，multiplier为缩放系数，默认赋值为1.0；在所述自注意力机制处理完毕后，在所述Transformer模块中增加一个可学习的权重向量lff，输出经过线性层，并根据经过线性层的输出数据获得需要调整的参数量，具体为：获取预设的所需向量维度train_dim，根据所述所需向量维度train_dim对权重向量lff进行定义，其中，所述所需向量维度train_dim与所述自注意力机制中的矩阵维度相对应；将所述权重向量lff初始化为零；在k矩阵中增加所述权重向量lff时，将所述权重向量lff与所述自注意力机制处理后的矩阵元素对应进行相乘，根据当前所述Transformer模块的输入特征x和缩放系数multiplier对所述Transformer模块的输出特征y进行重新赋值，赋值公式为：y=x1+weightmultiplier，其中，weight为所述权重向量lff，multiplier为缩放系数，默认赋值为1.0；根据训练样本以及需要调整的参数量对所述大模型进行微调，生成与所述物品的数据信息相对应的图片。

全文数据：

权利要求：

百度查询：厦门蝉羽网络科技有限公司基于学习权重向量的大模型微调方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

下一篇：一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

相关技术

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种钢带波纹螺旋管接头防护模具_吉林建工集团有限公司_202322063597.1

一种旋转式防撞护栏和混凝土护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419697.3

双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

一种籽晶自动熔接结构_四川永祥光伏科技有限公司_202322431204.8

一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

一种高效型苗种植机_海南勤璞园农业科技有限公司_202322496666.8

CNC加工用快速换线治具_东莞华清光学科技有限公司_202322418777.7

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

微调相关技术

一种自然语言推理微调方法、系统、装置及存储介质_华南理工大学_202210179894.X

基于指令微调和检索增强生成的在线智能问答方法及装置_杭州有赞科技有限公司_202410118530.X

一种模切刀具微调自动定位装置_深圳市福泉兴模切刀具科技有限公司_202322244565.1

方便微调的电视机支架精密冲压模具_深圳市润恒泰实业有限公司_202321789035.9

一种用于DMD数字微镜阵列的便捷焦面微调装置_苏州迈科芯纳智能科技有限公司_202322538726.8

基于学习权重向量的大模型微调方法、装置、设备及介质_厦门蝉羽网络科技有限公司_202410177508.2

一种色选机相机的微调校正结构_安徽捷迅光电技术有限公司_202410236539.0

基于预训练语言模型提示微调的开放知识图谱补全方法、装置_中国人民解放军国防科技大学_202410041466.X

一种动目标轨迹拐角平缓微调的平滑优化方法和系统_中微智创(北京)软件技术有限公司_202311297795.2

一种用于生产SMD晶体谐振器的微调盘_无锡神山科技有限公司_202322354930.4

方法相关技术

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

通信方法及装置_华为技术有限公司_202010617172.9

信息处理方法_丰田自动车株式会社_202311358127.6

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

冰箱及其控制方法_LG电子株式会社_202080061858.2

冰箱及其控制方法_重庆海尔制冷电器有限公司_202211295888.7

模型相关技术

结构识别模型训练、模型结构识别方法、设备及介质_北京燧原智能科技有限公司_202410090059.8

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

用于模型蒸馏的方法和装置_北京百度网讯科技有限公司_202011473804.5

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

一种手板模型用打磨设备_青岛诚品模型有限公司_202322254282.5

基于ARIMA模型的容量预测装置及其控制方法_上海新炬网络信息技术股份有限公司_202010209101.5

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

模型处理方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202011056384.0

利用模型增强的自监督学习_硕动力公司_202280060208.5

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

龙图腾网&IPTOP

【发明授权】基于学习权重向量的大模型微调方法、装置、设备及介质_厦门蝉羽网络科技有限公司_202410177508.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务