申请/专利权人:北京理工大学;中国科学院大学
申请日:2022-08-01
公开(公告)日:2024-04-02
公开(公告)号:CN115393678B
主分类号:G06V10/80
分类号:G06V10/80;G06V10/82;G06F40/216;G06N3/045;G06N3/0464;G06N3/048;G06N3/084;G06V10/30;G06V10/774
优先权:
专利状态码:有效-授权
法律状态:2024.04.02#授权;2022.12.13#实质审查的生效;2022.11.25#公开
摘要:本发明公开了一种基于图像式中间态的多模态数据融合决策方法,包括确定决策任务涉及的多模态数据;设计多模态数据统一转换为图像模态数据的方法;面向决策任务获取多模态样本数据,并统一为图像模态以构造训练集和测试集;基于训练集和测试集,训练融合注意力机制的多通道深度神经网络;采集用于决策的多模态数据,并统一转换为图像模态以构造决策数据集;将决策数据集输入多通道深度神经网络进行特征自适应提取与融合决策。本发明既避免了多特征提取模型导致的复杂网络设计和大量参数寻优问题,又可方便地、仅使用一个硬件加速设备来完成快速的神经网络计算;增强深度神经网络各通道提取特征的交互性和互补性;减少冗余特征的输入。
主权项:1.一种基于图像式中间态和深度学习的多模态数据融合决策方法,包括以下步骤:确定决策任务涉及的多模态数据,多模态数据包括文本、信号、图像、视频数据;设计多模态数据分别转换为对应的多种类型图像的方法;面向任务获取多模态样本数据,并将多模态数据转换为对应的多种类型图像,构造训练集和测试集,其中,将文本数据转换为灰度图,将信号数据转换为灰度图或二维时频图,将视频转换为关键帧或二维光流场图;基于训练集和测试集,设计和训练融合注意力机制的多通道深度神经网络;采集用于决策的多模态数据,并转换为对应的多种类型图像数据以构造决策数据集;将决策数据集输入融合注意力机制的多通道深度神经网络进行特征自适应提取与融合决策。
全文数据:
权利要求:
百度查询: 北京理工大学;中国科学院大学 一种基于图像式中间态的多模态数据融合决策方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。