【发明授权】文本描述辅助的姿势感知的人脸表情识别方法_中国科学技术大学;招商银行股份有限公司_202210683619.1

申请/专利权人：中国科学技术大学;招商银行股份有限公司

申请日：2022-06-16

公开（公告）日：2024-04-16

公开（公告）号：CN114944002B

主分类号：G06V40/16

分类号：G06V40/16;G06V40/70;G06N3/08;G06N3/0464;G06V10/82;G06F40/30;G06F40/289

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2022.09.13#实质审查的生效;2022.08.26#公开

摘要：本发明公开了一种表情描述文本辅助的姿势感知的人脸表情识别方法，包括：1、根据表情发生时的面部单元动作和对原始人脸图像的预处理，构建出多模态数据集合；2、构建姿势分类器，从人脸图像中提取姿势特征，并选取各种姿势的聚类中心作为对应的姿势特征；3、构建表情描述文本特征提取器，从文本中提取表情文本特征；4、融合人脸视觉特征，姿势特征和表情文本特征，以跨模态的方式为视觉特征生成对应姿势和表情的注意力图，并通过同时区分注意力图加权后的视觉特征的姿势和表情类别，从而得到最优表情表征网络。本发明能有效利用先验姿势特征和表情描述文本丰富的语义信息，从而能实现任意姿势下的表情的精准识别。

主权项：1.一种文本描述辅助的姿势感知的人脸表情识别方法，其特征在于，是按如下步骤进行：步骤1、构建多模态数据集合A；步骤1.1、构建多模态数据的表情描述文本集合，记为其中，sk表示第k条文本，m为文本的总条数；所述第k条文本sk包含的单词，记为其中，tk,l表示所述第k条文本sk中的第l个单词，Nk表示第k条文本信息的单词长度；步骤1.2、构建多模态数据的表情图像数据集合：获取真实人脸图像数据集并使用图像旋转、裁剪以及归一化的方法进行预处理，从而得到表情图像数据集其中，xi，yi，vi分别表示第i个人脸图像及对应的表情类别和姿势类别，yi∈{1,2,…,m'}，vi∈{1,2,…,n}，N是表情图像数据集D中图像的数量，m'是表情的总类别数，n是姿势的总类别数，且m'＝m；步骤2、构建姿势分类器，包含：姿势特征提取器Ep，分类器Cp和特征对齐器AL：步骤2.1、构建所述姿势特征提取器Ep为ResNet50结构：所述ResNet50结构由一个卷积层，一个批归一化层，一个ReLU激活函数层，一个最大池化层，四个深度残差块和一个平均池化层组成；步骤2.2、提取姿势特征：将所述表情图像数据集D的第i个人脸图像xi输入所述姿势特征提取器Ep中，获得第i个人脸图像xi的姿势特征步骤2.3、构建所述分类器Cp，包含一个全连接层：将所述姿势特征输入到所述分类器Cp中，得到第i个人脸图像xi预测的姿势类别v'i；步骤2.4、利用式1构建姿势分类损失Lpose：Lpose＝crossentropyv′i,vi1式1中，crossentropy表示交叉熵函数；步骤2.5、利用式2计算第j种姿势的特征fj，从而得到n种姿势的特征：式2中，nj表示预测的姿势类别v'i和真实的姿势类别vi都为第j种姿势类别的姿势特征集合的特征数量；步骤2.6、构建所述特征对齐器AL，包含一个全连接层：将所述第j种姿势的特征fj输入到所述特征对齐器AL中，得到对齐后的第j种姿势特征步骤3、构建表情描述文本特征提取器，包含：分词器Et，文本内特征编码器Eintra和文本间特征编码器Einter：步骤3.1、构建所述分词器Et，依次包含文本预处理层、特殊符号添加层、符号数字化层和序列对齐层；将所述表情描述文本集合S的第k条文本sk输入到所述分词器Et中进行处理，获得对应的第k个数字序列以及对应的第k个位置编码为pck；步骤3.2、构建文本内特征编码器Eintra，包含：嵌入层和多层Transformer编码器；所述Transformer编码器由一个多头自注意力子层和一个前馈子层以残差方式连接而成；将所述第k个数字序列和第k个位置编码pck输入到所述文本内特征编码器Eintra中进行处理，获得第k个初步表情描述文本特征步骤3.3、构建所述文本间特征编码器Einter，包含：多层Transformer编码器；将所有初步表情描述文本特征输入到所述文本间特征编码器Einter中进行处理，获得最终表情描述文本特征其中，表示第k条表情文本描述特征；步骤4、构建跨模态模块，包含：图像视觉特征提取器Ev，姿势分类器Cp和表情分类器Ce：步骤4.1、构建所述图像视觉特征提取器Ev，包含部分ResNet50的层结构；所述部分ResNet50的层结构包含一个卷积层，一个批归一化层，一个ReLU激活函数层，一个最大池化层和三个深度残差块；将所述表情图像集D的第i个人脸图像xi输入到图像视觉特征提取器Ev中进行处理，获得第i个人脸图像xi的视觉特征步骤4.2、生成注意力图：步骤4.2.1、利用式3计算对齐后的第j种姿势特征第k种表情文本描述特征与视觉特征的余弦矩阵式4中，×表示矩阵乘法，|·|表示沿着第0维求和；步骤4.3.2、利用式4计算余弦矩阵经激活函数ReLU后的矩阵步骤4.3.3、利用式5计算矩阵经归一化函数Norm后的注意力图步骤4.4、利用式6计算第i个人脸图像xi的最终特征Fi：式6中，w和h分别表示视觉特征的宽度和高度，表示注意力图中按照先行后列的顺序排列后的第q个注意力权重，表示视觉特征中按照先行后列的顺序排列后的第q个视觉特征；步骤4.4、构建姿势分类器Cp和表情分类器Ce：所述姿势分类器Cp和表情分类器Ce均为一个全连接层；步骤4.5、将所述最终特征Fi分别输入到所述分类器Cp和分类器Ce中，并相应得到所述分类器Cp预测的人脸图像xi的姿势类别和所述分类器Ce预测的人脸图像xi的表情类别步骤4.6、利用式7构建总分类损失Lall：步骤4.7、基于构建的多模态数据集合A，利用梯度下降的方法对所述文本间特征编码器Einter，图像视觉特征提取器Ev，姿势分类器Cp和表情分类器Ce进行训练，计算所述总分类损失Lall用于更新网络参数，并在总分类损失Lall最小时停止训练，从而得到最优表情表征网络，用于同时对姿势和表情进行识别。

全文数据：

权利要求：

百度查询：中国科学技术大学;招商银行股份有限公司文本描述辅助的姿势感知的人脸表情识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

下一篇：一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

相关技术

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

配备可拆固定式导纸嘴的打印装置_长城信息股份有限公司_202322616485.4

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

一种网格化终端旋转装置_北京国旺盛源智能终端科技有限公司_202322619930.2

一种园林绿化便携铲_马丽丽_202322375183.2

一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

一种实验室地层品质因子估算方法_中国石油化工股份有限公司_202211297976.0

感知相关技术

用于内容感知填充的内容感知采样区域的自动合成_奥多比公司_202010108650.3

基于感知的通信方法及装置_华为技术有限公司_202211296757.0

一种基于物联感知的多模态数据智能推荐方法及系统_湖南麓川信息科技有限公司_202410137355.9

面向触觉感知的高动态阵列式电容测量电路及其测量方法_之江实验室_202110830626.5

用于深度学习的数据感知存储分层和生命周期数据估值_慧与发展有限责任合伙企业_202310766514.7

感知测量建立方法、电子设备及存储介质_北京小米移动软件有限公司_202280003117.8

基于多类别自适应感知网络的检测方法、系统及存储介质_泉州市联友软件科技有限公司_202410078651.6

一种基于感知损失的乳腺MRI影像时间序列生成方法_杭州电子科技大学_202210058765.5

基于LEGO-LOAM的可调式大角度探测感知及控制方法_智能移动机器人(中山)研究院_202110822519.8

一种面向流引导纳米网络循环感知的机会路由方法_浙江工业大学_202111475640.4

姿势相关技术

一种礼仪姿势训练装置_淄博职业学院_202322459446.8

基于身体姿势控制交互式时尚_斯纳普公司_202280058680.5

文本描述辅助的姿势感知的人脸表情识别方法_中国科学技术大学_202210683619.1

一种方便更换姿势的尿意引导盆_遂宁市中医院_202321897446.X

一种姿势调节方法、系统、设备和可读存储介质_威海矩侨工业科技有限公司_202410157088.1

车辆中的人的姿势检测_APTIV技术股份公司_202311285560.1

用于支撑下蹲姿势的脚搁置件及其用途_迪特尔·罗曼·迪尔_201880088439.0

将姿势识别与网页实时通信连接_铃盛公司_202211208589.5

一种叶片姿势调整设备的悬架结构_科东自动化科技(嘉善)有限公司_202322555617.7

修改二维图像中二维人类的姿势_奥多比公司_202311286078.X

人脸相关技术

人脸活体检测装置和人脸活体检测方法_北京与光科技有限公司_202211281255.0

一种人脸识别方法及装置_普天信息技术有限公司_201910322661.9

人脸识别方法、装置、计算机设备及存储介质_平安科技(深圳)有限公司_201910268066.1

一种机械电子混合型人脸识别智能锁_深圳市宏领智联科技有限公司_202322449710.X

人脸光照评价方法、装置、计算机可读存储介质及设备_北京眼神智能科技有限公司_201911138250.0

活化人脸视频的检测方法、装置、设备及存储介质_平安银行股份有限公司_202111158209.7

人脸活体检测方法、系统、设备及可读存储介质_新大陆数字技术股份有限公司_201911387862.3

一种人脸识别校园安防管理系统_广西申能达智能技术有限公司_202322651755.5

人脸年龄变化图像对抗生成方法及系统_中国科学院自动化研究所_202010441089.0

伪造人脸图片的识别方法、装置、计算机设备及存储介质_恒安嘉新(北京)科技股份公司_202111027883.1

龙图腾网&IPTOP

【发明授权】文本描述辅助的姿势感知的人脸表情识别方法_中国科学技术大学;招商银行股份有限公司_202210683619.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务