首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】半监督多模态情感分析方法、系统、存储介质及计算机_江西尚通科技发展有限公司_202410363113.1 

申请/专利权人:江西尚通科技发展有限公司

申请日:2024-03-28

公开(公告)日:2024-05-03

公开(公告)号:CN117975342A

主分类号:G06V20/40

分类号:G06V20/40;G06V20/62;G06V10/74;G06V10/82;G06N3/048;G06N3/088;G06N3/0895

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.21#实质审查的生效;2024.05.03#公开

摘要:本发明提供一种半监督多模态情感分析方法、系统、存储介质及计算机,该方法包括以下步骤:获取样本数据的音频模态特征、视频模态特征及字幕模态特征;对各特征进行拼接融合得到跨模态特征及跨模态情感预测值;将跨模态特征进行拼接融合得到多模态特征,以得到第一多模态情感值;基于相似性约束损失函数,获取包含特异性与关联性的多模态特征表示,以得到预测情感值。通过采用多模态特征表示方法,有助于捕获蕴含异性与关联性的特征表示,无需复杂的网络设计,极大的降低了模型的训练成本,同时能够学习互联网或现实场景海量的无标注的多模态样本进一步提升情感分析性能;并通过半监督方法学习无监督多模态数据,进一步提升预测情感值的精度。

主权项:1.一种半监督多模态情感分析方法,其特征在于,包括以下步骤:获取样本数据的音视频模态特征,对所述音视频模态特征进行特征提取,以得到音频模态特征、视频模态特征及字幕模态特征;对所述音频模态特征、视频模态特征及字幕模态特征进行拼接融合得到跨模态特征,并经过神经网络线性层和sigmod激活函数,将所述跨模态特征映射为回归值,以得到样本的跨模态情感预测值,其中,所述跨模态特征包括与所述音频模态特征及所述视频模态特征对应的第一跨模态特征、与所述音频模态特征及所述字幕模态特征对应的第二跨模态特征,及与所述视频模态特征及所述字幕模态特征对应的第三跨模态特征;将所述跨模态特征进行拼接融合得到多模态特征,并经过神经网络线性层和sigmod激活函数,将所述跨模态特征映射为回归值,以得到所述样本数据对应的第一多模态情感值;基于相似性约束损失函数,逼近所述跨模态情感预测值及所述第一多模态情感值,以获取包含特异性与关联性的多模态特征表示,从而基于所述多模态特征表示得到预测情感值: ; ; 式中,表示所述相似性约束损失函数,表示第i个样本的第一多模态情感值,表示第i个样本的跨模态情感预测值,表示所述跨模态特征的权重,表示所述第一跨模态特征,表示所述第二跨模态特征,表示所述第三跨模态特征,表示有监督数据的样本数量。

全文数据:

权利要求:

百度查询: 江西尚通科技发展有限公司 半监督多模态情感分析方法、系统、存储介质及计算机

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。