【发明公布】基于时空双向扩张因果卷积和Transfomer的多模态情感识别方法_南京邮电大学_202311644928.9

申请/专利权人：南京邮电大学

申请日：2023-12-04

公开（公告）日：2024-03-22

公开（公告）号：CN117744022A

主分类号：G06F18/25

分类号：G06F18/25;G06V40/16;G06V10/82;G06N3/0464;G06F18/241

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本发明提供了一种基于时空双向扩张因果卷积和Transfomer的多模态情感识别方法，包括：处理表情、语音模态的视频，得到表情序列和语谱图序列，提取姿态特征得到姿态特征序列；ResNet18网络处理表情和语音模态，得到特征图，重排列特征图构成对应的空间特征序列；对得到的空间特征序列通过空间注意力双向扩张因果卷积网络捕获空间上的依赖关系；再将表情和语音特征序列以及姿态特征序列送入时间注意力双向扩张因果卷积网络捕获时间上的依赖关系；将表情、语音、姿态特征堆叠得到特征矩阵，通过Transformer实现特征融合。本发明通过时空双向扩张因果卷积网络捕获模态内部的时空依赖，获得聚合了时空信息的高级模态特征，采用Transformer捕获模态间的特征交互，实现多模态特征融合。

主权项：1.一种基于时空双向扩张因果卷积和Transfomer的多模态情感识别方法，其特征在于，包括如下步骤：步骤一、通过Opencv库处理表情模态得到视频序列，通过Dlib库得到所述视频序列中的人脸从而得到表情图像，从所述表情图像中等间隔提取8帧表情图像，所述8帧表情图像构成表情图像序列；通过Spicy库将语音模态从所述视频序列转换为音频序列，通过pydub库对所述音频序列进行切割，得到5段音频段落以及完整音频段落，从所述5段音频段落和所述完整音频段落中提取Log-Mel语谱图、一阶语谱图以及二阶语谱图，得到长度为6的语谱图序列；从所述视频序列中等间隔提取10帧姿态特征得到姿态特征序列；步骤二、通过ResNet18网络处理每帧所述表情模态和每帧所述语音模态，得到表情模态特征图和语音模态特征图，对所述表情模态特征图和所述语音模态特征图进行重排列，构成表情和语音模态序列每帧图像对应的表情空间特征序列和语音空间特征序列；步骤三、对所述表情空间特征序列和所述语音空间特征序列分别通过空间注意力双向扩张因果卷积网络捕获空间上的依赖关系；步骤四、将经过所述空间双向扩张因果卷积网络处理后得到的所述表情空间特征序列和所述语音空间特征序列以及所述姿态特征序列送入时间注意力双向扩张因果卷积网络捕获时间上的依赖关系；步骤五、对所述步骤四得到的表情特征、语音特征和姿态特征堆叠得到特征矩阵，然后通过Transformer进行特征融合。

全文数据：

权利要求：

百度查询：南京邮电大学基于时空双向扩张因果卷积和Transfomer的多模态情感识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

下一篇：一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

相关技术

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

一种车载冰箱移动组件_一汽解放汽车有限公司_202322605238.4

多模相关技术

一种棉花圆模搬运开模装置_中华全国供销合作总社郑州棉麻工程技术设计研究所_202210819840.5

一种成型刀模装置_安徽明天氢能科技股份有限公司_202322689995.4

一种共模电感_江苏英飞源智慧能源有限公司_202210565350.7

OCA圆刀反向模切设备_东莞市钛科光电科技有限公司_202322290787.7

一种压弯下模工装_山东矿机华能装备制造有限公司_202322693518.5

一种应用于隧道管片钢模的端板合模检测方法及系统_盐城市巨能动力机械有限公司_202310995349.2

一种铆钉平模加工夹具_昆山佳鸿机械五金有限公司_202322432369.7

一种标牌制作用模切装置_枣阳市德宇印务有限公司_202321962440.6

一种便于取件的石膏模盒_甘肃鑫河邦建材有限公司_202322239165.1

一种便于换模的注塑机_东莞市今通塑胶机械有限公司_202322467545.0

积相关技术

一种使用干冰清洗汽车活塞积碳的操作方法及干冰清洗机_浙江申通时代汽车销售服务有限公司_202211032153.5

一种插装式积料筋板_韶瑞重工(广东)有限公司_202322097003.9

一种抗积屑磨损的滚刀及其生产工艺_马鞍山宝祥机械刀模有限公司_202210247034.5

防止废气再循环系统积碳的方法、装置、电子设备及车辆_长城汽车股份有限公司_202410115669.9

一种锌电积工序预防断路炸槽事故发生的装置_甘肃厂坝有色金属有限责任公司_202322208594.2

便于防止基坑边缘积土的建筑深基坑结构_中建八局第四建设有限公司_202410302739.1

一种天然气蓄热烧嘴防积碳结构_智焱(无锡)热工科技有限公司_202322636619.9

一种贵金属锑电积污水处理设备_甘肃招金贵金属冶炼有限公司_202322461092.0

一种雪花冰沙机的滚筒防积堆装置_陈锦荣_202322275509.4

一种光伏电池板防积灰装置_国电电力甘肃新能源开发有限公司_202410077978.1

Transfomer相关技术

一种基于CNN-Transfomer的自监督视频分割方法和系统_浙江树人学院_202310953967.0

基于Swin-Transfomer的结构拓扑优化方法_广东工业大学_202310319410.1

一种transfomer模型处理方法、可读存储介质及设备_佛山科学技术学院_202210082776.7

基于transfomer的非接触式呼吸率测量方法_中国科学院自动化研究所_202210232829.9

龙图腾网&IPTOP

【发明公布】基于时空双向扩张因果卷积和Transfomer的多模态情感识别方法_南京邮电大学_202311644928.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务