买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于Transformer的物流包裹分离方法_华南理工大学_202210346880.2 

申请/专利权人:华南理工大学

申请日:2022-04-02

公开(公告)日:2024-04-16

公开(公告)号:CN114708295B

主分类号:G06T7/215

分类号:G06T7/215;G06T7/246;G06T7/277;G06T7/13;G06T5/70;G06T5/60;G06T5/10;G06T5/30;G06N3/0464;G06N3/048;G06N3/0499;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.07.22#实质审查的生效;2022.07.05#公开

摘要:本发明公开了一种基于Transformer的物流包裹分离方法,包括以下步骤:将图像送入改进的Transformer语义分割模型,将接收的图像划分为多个图块并将图块传入分层编码器,该编码器利用重叠特征合并操作、前馈神经网络结合自注意力机制输出不同分辨率的多级图像特征;使用轻量级的基于多层感知机的解码器进行特征拼接和融合,预测出图像的包裹分割掩码信息;对于该掩码信息进行图像形态学后处理,提取出所有包裹的边缘信息,获取当前包裹的分布情况后对包裹在传送带上的分布情况进行统计,获取在传送带最前方的包裹作为目标包裹,将此目标包裹信息作为卡尔曼滤波目标跟踪环节的更新输入,从而实现对于物流包裹的单件分拣。

主权项:1.一种基于Transformer的物流包裹分离方法,其特征在于,包括以下步骤:1实时采集物流包裹的原始图像,选取原始包裹图像的感兴趣区域;2将原始图像的感兴趣区域作为输入特征传入具有分层结构的改进的Transformer语义分割模型中,每个层级均进行如下步骤:21使用重叠特征合并操作使特征图的尺度随着语义分割模型的加深而缩减,将输出的特征图映射为特征序列后传入到自注意力模块;22通过自注意力模块计算注意力特征,通过线性层对序列长度进行缩减;23将自注意力模块的输出特征传入前馈神经网络;所述前馈神经网络使用卷积核进行卷积操作,采用高斯误差线性单元作为激活函数,并经过全连接线性层得到多级特征;高斯误差线性单元公式如下: 其中,x为激活函数的输入值,为高斯分布的概率函数,X为随机变量,P为概率函数,tanh为双曲正切函数;24将多级特征通过线性层统一通道维数;将各级特征上采样并进行特征拼接;通过线性层融合拼接后的各级特征;具体由基于多层感知机的解码器模块完成,在获取编码器输出的多级特征Fi后,经过一个线性层将各级特征图的通道数统一为C:Fi,c=LinearCi,CFi,i=1,2,3其中Ci为原来的特征图Fi的通道数,Fi,c为统一通道数为C后的特征图;之后上采样为原特征图尺寸的 其中H为图像宽度,W为图像高度,为经过上采样操作后的特征图;将上采样得到的特征拼接起来并通过一个线性层进行融合,将拼接后的特征维度重新压缩至C: 其中Ffuse表示为该线性层输出的融合特征;融合后的特征通过一个全连接线性层输出预测的分割掩码M:M=LinearC,NpFfuse其中Np为包裹个数;25将融合特征输入至感知机层,预测得到分割掩膜;26对于获得的特征掩膜进行形态学开运算,得到去除噪声的二值图像;使用边缘检测算法提取用于分离的包裹边缘信息;3建立运动模型,运用相关滤波方法,综合运动模型和检测模型的信息,对图像中最前方的包裹进行追踪。

全文数据:

权利要求:

百度查询: 华南理工大学 一种基于Transformer的物流包裹分离方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。