【发明公布】一种多模态短视频的情感可视化分析方法及系统_中国传媒大学_202410306890.2

导航：龙图腾网> 最新专利技术> 一种多模态短视频的情感可视化分析方法及系统_中国传媒大学_202410306890.2

申请/专利权人：中国传媒大学

申请日：2024-03-18

公开（公告）日：2024-04-16

公开（公告）号：CN117892260A

主分类号：G06F18/25

分类号：G06F18/25;G06N3/0455

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.03#实质审查的生效;2024.04.16#公开

摘要：本发明公开了一种多模态短视频的情感可视化分析方法及系统，属于人工智能技术领域，包括：将多模态短视频输入数据格式预处理模块进行预处理；将预处理得到的视频和音频模态的数据输入无声检测模块，检测音频说话人的停顿点，将视频和音频切分为若干片段；将每个片段的音频数据输入到Whisper模型，转录得到文本模态的数据；利用音频检测的停顿点，对齐视频模态、音频模态和文本模态的数据，将同一片段的三种模态数据输入到V2EM‑RoBERTa模型，得到每个片段的情感预测结果；将各个片段的情感预测结果进行融合，得到多模态短视频整体的情感预测结果。本发明采用上述的一种多模态短视频的情感可视化分析方法及系统，提高了现有模型的文本模态的情感分析性能和准确性。

主权项：1.一种多模态短视频的情感可视化分析方法，其特征在于，包括以下步骤：S1、将多模态短视频数据集输入数据格式预处理模块进行预处理，实现不同分辨率视频的自适应压缩，得到视频模态和音频模态的数据；S2、将得到的视频模态和音频模态的数据输入无声检测模块，通过检测音频的说话人的停顿点，将视频和音频切分为若干片段；S3、将每个片段的音频数据输入到Whisper模型，转录得到文本模态的数据；S4、利用步骤S2检测的停顿点，对齐视频模态、音频模态和文本模态的数据，将同一时期的三种模态数据输入到V2EM-RoBERTa模型中，得到每个片段的情感预测结果；S5、将各个片段的情感预测结果进行决策层线性融合，得到多模态短视频整体的情感预测结果。

全文数据：

权利要求：

百度查询：中国传媒大学一种多模态短视频的情感可视化分析方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种与子痫前期相关的生物标志物及其应用_广州医科大学附属第三医院(广州重症孕产妇救治中心、广州柔济医院)_202311782006.4

下一篇：一种锌镍电池生产用智能检测装置_上海研闻科技有限公司_202410385316.0

相关技术

一种与子痫前期相关的生物标志物及其应用_广州医科大学附属第三医院(广州重症孕产妇救治中心、广州柔济医院)_202311782006.4

一种锌镍电池生产用智能检测装置_上海研闻科技有限公司_202410385316.0

防止请求重复访问方法、装置、计算机设备及存储介质_平安科技(深圳)有限公司_201910513716.4

成型大尺寸不同厚度平板类复合材料构件的通用模压成型模具_北京新风航天装备有限公司_201711453602.2

擦拭装置及电池正极激光焊接装置_无锡先导智能装备股份有限公司_201910164952.X

一种圆柱型锂离子电池的壳体分解装置_力神动力电池系统有限公司_201810920064.1

一种平流式微通道反应器_浙江工业大学上虞研究院有限公司_201810964345.7

一种稳定性好的美容用光谱仪系统及稳定方法_广州市芯科电子科技有限公司_202311867099.0

一种混凝土砌块生产设备_宝鸡方正致远节能建材有限公司_202310743462.1

一种基于打猎相机目标物监控数据的处理系统及方法_深圳市超诺科技有限公司_202410078350.3

异位性皮肤炎的治疗_高德美控股有限公司_202280059386.6

用于预填充式注射器中的柱塞-塞子深度测量的设备、系统和方法_美国安进公司_202280062261.9

龙图腾网&IPTOP

【发明公布】一种多模态短视频的情感可视化分析方法及系统_中国传媒大学_202410306890.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务