【发明授权】一种敏感信息发现模型的多模态数据增强方法_环球数科集团有限公司_202311638869.4

导航：龙图腾网> 最新专利技术> 一种敏感信息发现模型的多模态数据增强方法_环球数科集团有限公司_202311638869.4

申请/专利权人：环球数科集团有限公司

申请日：2023-12-04

公开（公告）日：2024-03-22

公开（公告）号：CN117370934B

主分类号：G06F18/25

分类号：G06F18/25;G06F18/10;G06V10/80;G06V10/40;G06V10/82

优先权：

专利状态码：有效-授权

法律状态：2024.03.22#授权;2024.01.26#实质审查的生效;2024.01.09#公开

摘要：本发明公开了一种敏感信息发现模型的多模态数据增强方法与装置，属于人工智能技术领域。所述增强方法使用多编码器结构中的不同编码器对源数据中不同模态的数据进行分别编码，以保持各自的语义特征。其中，以图像数据为主，辅助以语音、文本等上下文数据进行编码。编码后的两类数据均输入到解码器进行融合处理。解码器中设置有注意力机制，可以聚焦不同编码器的输出，对源数据的可疑区域进行重新标注和增强。增强后的数据输出到敏感信息发现模型，可提高后续模型的处理效率与精确度。同时提出一种应用所述数据增强方法的装置，可在已在设备中接入该装置，即可以使现在的模型在输入端获取到增强后的源数据。

主权项：1.一种敏感信息发现模型的多模态数据增强方法，其特征在于，所述增强方法包括以下步骤：S100：从第一数据源接收含有多模态信息的源数据，从源数据中获得包括视频和或图像的视频数据；使用图像分析器分析视频数据，从而生成多个时序上的图像特征向量；S200：进一步处理源数据中的多模态数据，获得包括声音、情感、说话者特征中的一项或一项以上特征的数据；至少基于人物、情绪、噪音特征中的一项或一项以上特征生成上下文数据；S300：使用多编码器变换器处理图像特征向量和上下文数据，以生成具有可疑信息时间标记的增强源数据，并将所述增强源数据输出到敏感信息发现模型作进一步的敏感信息分析；其后在敏感信息发现模型的分析设置中，设置重点分析标记的敏感时间段，次要分析未标记时间段，忽略无标记段，并最终输出对源数据中的敏感信息的发现结果；其中，所述多编码器变换器包括：第一编码器，包括第一注意力网络，用于将所述图像特征向量编码处理为第一编码数据；第二编码器，包括第二注意力网络，用于将所述上下文数据编码处理为第二编码数据；解码器，其包括解码注意力网络；之后，将所述第一编码数据以及所述第二编码数据输入到所述多编码器变换器中对应的解码器，利用所述解码器的解码注意力网络对可疑信息进行时间标记；所述方法还包括从除所述第一数据源以外的一个或多个的其他数据源直接获取所述上下文数据；其中，步骤S300中还包括以下子步骤：S310：对所述图像特征向量进行图像帧序列处理，为图像特征向量的n个图像帧进行编号，每个图像帧的编号分别为f1，f2，...fn；S320：对第i个图像帧fi计算其可疑信息特征向量Ki和敏感信息特征向量Li；S330：对每个图像帧fi抽取其图像特征向量Fi；S340：定义权重矩阵ωi，对抽取的图像特征向量Fi进行加权；S350：计算视频数据的可疑信息重点指数X，即：；上式中，表示向量对应元素相乘；σ表示非线性激活函数；S360：根据重点指数X，对源数据在时间序列上进行可疑信息标记。

全文数据：

权利要求：

百度查询：环球数科集团有限公司一种敏感信息发现模型的多模态数据增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

下一篇：再生废液处理系统_山东荣信集团有限公司_202322260404.1

相关技术

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

一种点火线圈密封结构_一汽解放汽车有限公司_202322812056.4

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

一种万寿菊用大型烘干机_丘北立达尔生物科技有限公司_202322498434.6

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

多模相关技术

一种棉花圆模搬运开模装置_中华全国供销合作总社郑州棉麻工程技术设计研究所_202210819840.5

一种成型刀模装置_安徽明天氢能科技股份有限公司_202322689995.4

一种共模电感_江苏英飞源智慧能源有限公司_202210565350.7

OCA圆刀反向模切设备_东莞市钛科光电科技有限公司_202322290787.7

一种压弯下模工装_山东矿机华能装备制造有限公司_202322693518.5

一种应用于隧道管片钢模的端板合模检测方法及系统_盐城市巨能动力机械有限公司_202310995349.2

一种便于换模的注塑机_东莞市今通塑胶机械有限公司_202322467545.0

一种便于取件的石膏模盒_甘肃鑫河邦建材有限公司_202322239165.1

一种异形楼板支模结构_广东万得成建设工程有限公司_202322506361.0

一种铆钉平模加工夹具_昆山佳鸿机械五金有限公司_202322432369.7

态相关技术

用于溶解电站水汽中痕量胶态铁的混合催化剂_浙江西热利华智能传感技术有限公司_202210361398.6

一种F-T合成浆态床反应器的移热装置_内蒙古伊泰煤基新材料研究院有限公司_201810012901.0

一种基于薄膜铌酸锂的启钥式单孤子态光学微梳产生方法_浙江大学_202111216818.3

平板陶瓷干态膜净水设备_温州德安水处理有限公司_202410288359.7

流态冰蒸发器及使用该流态冰蒸发器的空调系统_中机十院国际工程有限公司_201810471365.0

一种极化混合纠缠态生成方法_南京邮电大学_202011229429.X

一种量子网络并行多跳受控隐形传态方法_西安邮电大学_202410215864.9

一种燃料电池系统冷态恒压启动控制方法_无锡威孚高科技集团股份有限公司_202410207041.1

一种基于LC谐振单元的可重构型三谐振态均衡电路_东方电气集团科学技术研究院有限公司_202311728009.X

一种三谐振态均衡电路及电池电压均衡优化控制方法_东方电气集团科学技术研究院有限公司_202311728010.2

模型相关技术

结构识别模型训练、模型结构识别方法、设备及介质_北京燧原智能科技有限公司_202410090059.8

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

用于模型蒸馏的方法和装置_北京百度网讯科技有限公司_202011473804.5

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

一种手板模型用打磨设备_青岛诚品模型有限公司_202322254282.5

基于ARIMA模型的容量预测装置及其控制方法_上海新炬网络信息技术股份有限公司_202010209101.5

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

模型处理方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202011056384.0

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

利用模型增强的自监督学习_硕动力公司_202280060208.5

龙图腾网&IPTOP

【发明授权】一种敏感信息发现模型的多模态数据增强方法_环球数科集团有限公司_202311638869.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务