【发明公布】基于Multi-head Attention机制的知识蒸馏的ResNext图像数据分析方法_太原理工大学_202311795597.9

申请/专利权人：太原理工大学

申请日：2023-12-25

公开（公告）日：2024-03-22

公开（公告）号：CN117746149A

主分类号：G06V10/764

分类号：G06V10/764;G06V10/82;G06V10/44;G06N3/0464;G06N3/047;G06N3/045;G06N3/096

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本发明公开了一种基于Multi‑headAttention机制的知识蒸馏的ResNext图像数据分析方法，涉及图像数据的分析和分类技术领域，具体为第一部分知识蒸馏部分，旨在训练出优秀的学生模型，第二部分是将Multi‑headAttention机制嵌入到ResNext神经网络结构中从而提高ResNext网络的分类效果，第三部分是将预处理后的图像数据输入训练好的网络模型中，让网络对其进行分析并分类，最终得到分类好的图像数据结果。本发明使得图像类的大数据经过神经网络的处理后能更加有利于使用者对于图像的识别和判断，可以减少不相关的数据，将不同类型的图像数据区分开，同类型的图像数据聚集在一块，使得在完成任务时减少大量的冗余操作，还能提高精确度，大大提高工作效率。

主权项：1.一种基于Multi-headAttention机制的知识蒸馏的ResNext图像数据分析方法，其特征在于：包括如下步骤：一、知识蒸馏：1）选择教师模型和学生模型：选择了ResNet作为教师模型，ResNet块结构具体为：数据首先进入底部的卷积层Conv，应用多个卷积核来提取特征；紧随第一个卷积层之后，有一个批量归一化层BatchNorm对卷积层的输出进行规范化处理，以稳定学习过程；之后通过ReLU激活层来接受批量归一化层的输出并应用非线性激活函数；第一个ReLU激活层之后是第二个卷积层Conv，它进一步处理数据，提取更高级的特征；第二个批量归一化层BatchNorm规范化第二个卷积层的输出；第二个ReLU激活层再次应用非线性激活；此时，第二个ReLU激活层的输出会被传递到一个加法操作节点；同时，原始输入或经过适当变换后的输入也被传递到这个加法操作节点；两者在此节点相加；加法操作之后，得到的结果通过一个ReLU激活层进行最后的非线性变换，然后输出到网络的下一部分；选择ResNext作为学生模型；ResNext分组卷积结构具体为：输入为256-din即输入特征图有256个通道；分支开始后，输入特征图被分成32条路径，基数为32，每条路径进行一系列相似的操作，这些操作被称为“transformations”，第一层卷积为：{256,1x1,4}：每条路径都开始于一个1x1的卷积层，这个层的目的是进行通道降维，将256个输入通道减少到4个，减少计算量；第二层卷积{4,3x3,4}：第一层卷积后的是一个3x3的卷积层，它在这4个通道上进行空间卷积；第三层卷积{4,1x1,256}：在第二层卷积后的是另一个1x1的卷积层，它的作用是进行通道升维，将通道数从4升回到256；之后合并分支：所有路径的输出都被合并，通过加法操作完成；每条路径的输出都相加，产生一个具有256个通道的输出特征图；最后输出{256-dout}：最后的输出特征图，它保持了与输入相同的通道数；并将ResNet训练好的权重和知识传输至ResNext模型；2）准备数据集：准备一个适用的数据集，包括图像样本以及对应的标签；从公开可用的图像分类数据集中选择一个合适的数据集，以便进行知识蒸馏的训练；所采用图像分类数据集包括CIFAR-10、CIFAR-100、ImageNet；将数据集分为两个部分：教师数据集和学生数据集，进行知识蒸馏的训练；教师数据集：这一部分数据用于训练教师模型，即ResNet，从整个数据集中随机选择一部分数据，确保教师数据集足够大以包含多个类别的样本，同时教师数据集的规模大于学生数据集，以确保教师模型具有足够的知识来传递给学生模型；学生数据集：这一部分数据用于训练学生模型，即ResNext；从剩余的数据集中选择一部分数据，作为学生数据集，学生数据集的规模小于教师数据集，但学生数据集的要求也要包含多个类别的样本，以确保学生模型能够有效地学习知识；在使用数据集进行知识蒸馏之前，进行数据预处理步骤，以确保数据的质量和一致性；这些操作包括图像的缩放、归一化、数据增强，以提高模型的训练效果和泛化能力；使教师数据集和学生数据集的标签保持一致，以确保训练时的对齐性；标签为图像对应的类别信息，使用独热编码或整数编码来表示；3）教师模型预测：使用教师模型对知识蒸馏数据集进行推理，生成教师模型的概率分布输出，用于指导学生模型；4）损失函数设计：定义适当的损失函数，将学生模型的输出与教师模型的输出进行比较，选择交叉熵损失函数：；其中M代表类别的数量，yic代表符号函数，若样本i的真实类别等于c，则yic取1，否则取0；pic代表观测i属于类别c的预测概率；N代表样本数量；5）训练学生模型：首先，我们初始化学生模型ResNext，使用预训练的权重或随机初始化；将训练数据集的图像输入学生模型中，计算学生模型的预测；使用蒸馏损失函数计算软目标损失和硬目标损失；通过反向传播算法，将梯度传播回学生模型，以更新模型的权重参数，最小化蒸馏损失；重复以上步骤，直到学生模型的性能收敛或达到预定的停止条件；二、将Multi-headAttention机制嵌入到ResNext神经网络结构：即通过Multi-headAttention机制对ResNext网络结构进行改造，具体如下：选择ResNext的若干层或模块中，引入Multi-headAttention模块，所述Multi-headAttention模块允许网络在不同的头部heads中处理图像特征，每个头部关注不同的特征子集，这样网络同时处理多个关键特征；Multi-HeadAttention是利用多个查询模块，来平行地计算从输入信息中选取多个信息；每个注意力关注输入信息的不同部分，然后再进行拼接；；在每个Multi-headAttention模块中，计算多个头部的注意力权重；注意力权重根据输入特征图计算，以确定哪些特征受到更多的关注；每个头部产生的特征被融合在一起，以生成具有丰富表示的新特征图；这些新特征图包含不同头部的关注信息，以增强网络的表达能力；改造后的ResNext网络保留原始的残差连接结构，确保了信息的流动和梯度的稳定性；Multi-headAttention模块与残差块相互交织，以确保网络的平衡性和稳定性；改造后的ResNext网络结构经过训练和微调，确保网络适应新的注意力机制；训练数据集和目标任务与步骤一中的ResNext模型相同；三、将预处理后的图像数据输入训练好的网络模型中，让网络对其进行分析并分类，在得到改进后的ResNext的网络后，通过预处理好的图像数据对改进后的网络进行知识蒸馏，训练到一定程度后会得到相应的权重和参数，此时模型具备了对于图像数据的分析以及分类能力，到此这个网络模型完成。

全文数据：

权利要求：

百度查询：太原理工大学基于Multi-head Attention机制的知识蒸馏的ResNext图像数据分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：燃料电池以及燃料电池的制造方法_丰田自动车株式会社_202110209899.8

下一篇：RS485总线中多传感器编址方法、数据采集设备和系统_广州鲁邦通物联网科技股份有限公司_202011486283.7

相关技术

燃料电池以及燃料电池的制造方法_丰田自动车株式会社_202110209899.8

RS485总线中多传感器编址方法、数据采集设备和系统_广州鲁邦通物联网科技股份有限公司_202011486283.7

一种农产品供应链信息管理系统_河南建设产业投资有限公司_202311393351.9

一种即时检验抗凝药物监测系统_北京倍肯恒业科技发展股份有限公司_202310581047.0

一种带角度弹性垫圈的热处理方法及热处理装置_贵州航天精工制造有限公司_202111464284.6

一种针织设备用高速烘干机_海阳市清鸿制衣有限公司_202410304172.1

微电网的控制方法及装置_北京天诚同创电气有限公司_202111653363.1

光催化装置嵌入沉砂池协同降解辣椒素污水与除砂_山东建筑大学_202111505610.3

一种基于红外检测技术的探测装置及使用方法_黎明职业大学_201911007934.7

一种直径与中继协作的信号空间分集传输方法_山东交通学院_202110011021.3

聚离子弹性体及其制备方法与应用_赛感科技(深圳)有限公司_202211412739.4

基于模糊控制的电力设备智能调控方法_太原理工大学_202410258512.1

蒸馏相关技术

溴素生产用蒸馏塔_山东顺成化学有限公司_202322914754.5

一种低温真空蒸馏装置_淄博君昊精馏技术有限公司_202322649505.8

超声波植物香油蒸馏柜_李而宏_201811279914.0

一种白酒蒸馏用上甑装置_河南红谷缘酒业有限公司_202323109221.6

一种艾草萃取用蒸馏装置_河南省神州神药业有限公司_202322750089.0

一种植物蒸馏加工设备_金华市黛巴莎生物科技有限公司_202322478987.5

使用蒸馏溶剂回收单丙二醇_芬欧汇川集团_202280063328.0

一种防止物料固化的蒸馏装置_浙江肯特催化材料科技有限公司_202322727096.9

一种果酒蒸馏釜_重庆左右逢源酒业有限公司_202322371649.1

一种自上料减压蒸馏设备_浙江省化工产品质量检验站有限公司_202323019131.8

知识相关技术

试题知识点的提取方法_广州云蝶科技有限公司_202010850830.9

知识问答方法、装置、电子设备及存储介质_北京奇艺世纪科技有限公司_202410242138.6

疾病知识检索与诊疗决策辅助系统_北京大学_202410178658.5

用于为在线课程建立知识库的方法_罗伯特·博世有限公司_202180101405.2

一种知识图谱构建系统_上海工程技术大学_202410237349.0

基于随机敏感度的知识迁移方法_华南理工大学_202210202516.9

交管知识检索方法、装置、系统、设备及存储介质_杭州海康威视数字技术股份有限公司_202311848626.3

知识图谱结合血常规检验数据的疾病筛率提升方法和系统_健数(长春)科技有限公司_202410426237.X

一种武器装备信息的知识图谱构建方法、系统及设备_中国人民解放军92941部队_202410256932.6

基于课后习题难度和学生能力的个性化知识追踪方法_广州铭德教育投资有限公司_202410151029.3

ResNext相关技术

一种融合LightGBM的ResNeXt网络气象目标细粒度识别方法_南京航空航天大学_202311759416.7

基于Multi-head Attention机制的知识蒸馏的ResNext图像数据分析方法_太原理工大学_202311795597.9

基于改进型ResNext模型的食品添加剂拉曼光谱检测方法和装置_杭州海康威视数字技术股份有限公司_202311296175.7

一种改进ResNeXt神经网络的轻量级多模态医学图像分类方法_中科智禾数字科技(北京)有限公司_202311022573.X

一种基于SE-ResNeXt铸件缺陷识别方法_北京航空航天大学江西研究院_202311493282.9

基于GMD图像化与改进ResNeXt的网络异常检测方法及装置_武汉大学_202311060003.X

一种基于数据增强和CSP-ResNeXt的风机齿轮箱故障诊断方法_三峡大学_202310579050.9

一种基于ResNeXt的智能机器人抓取方法_中北大学_202111056444.3

一种融合多导联注意力机制的ResNeXt网络分类方法_北京工业大学_202110999643.1

基于3D-ResNeXt网络和3D注意力机制模块的动态手势识别方法_常州工学院_202310631076.3

龙图腾网&IPTOP

【发明公布】基于Multi-head Attention机制的知识蒸馏的ResNext图像数据分析方法_太原理工大学_202311795597.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务