买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于相关性信息扩展的多模态虚假新闻识别方法及系统_济南大学_202210699828.5 

申请/专利权人:济南大学

申请日:2022-06-20

公开(公告)日:2024-04-09

公开(公告)号:CN115100664B

主分类号:G06V30/19

分类号:G06V30/19;G06V30/18;G06V30/262;G06V10/82;G06F16/35

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2022.10.14#实质审查的生效;2022.09.23#公开

摘要:本发明提供了一种基于相关性信息扩展的多模态虚假新闻识别方法及系统,所述方案包括:获取目标新闻的新闻文本及图像;提取所述目标新闻图像的语义表示以及颜色直方图向量,并进行融合,获得视觉融合特征;基于所述目标新闻的新闻文本进行特征提取,获得新闻文本特征;提取目标新闻图像的OCR文本,并基于OCR文本提取OCR文本特征;计算所述新闻文本特征和OCR文本特征的文本相关性特征;并计算所述新闻文本特征及视觉融合特征的相似度特征;将所述新闻文本特征、OCR文本特征、图像的语义表示、文本相关性特征和相似度特征进行拼接,输入预先训练的分类器,获得目标新闻是否为假新闻的判别结果。

主权项:1.一种基于相关性信息扩展的多模态虚假新闻识别方法,其特征在于,包括:获取目标新闻的新闻文本及图像;提取所述目标新闻图像的语义表示以及颜色直方图向量,并将所述语义表示以及颜色直方图向量进行融合,获得视觉融合特征;基于所述目标新闻的新闻文本进行特征提取,获得新闻文本特征;具体为:对目标新闻的新闻文本进行向量化处理,获得目标新闻文本的词向量矩阵;并基于所述词向量矩阵提取新闻文本特征;提取目标新闻图像的OCR文本,并对目标新闻的OCR文本进行向量化表示,获得目标新闻OCR文本的词向量矩阵;并基于所述OCR文本的词向量矩阵,提取OCR文本特征;具体为:使用光学字符数别技术对图像提取OCR文本;去除OCR文本中的空格、回车及标点符号;得到目标新闻的OCR文本的向量化表示;对OCR文本中的词语对应的词向量进行建模,得到OCR文本中每个词在当前上下文中的特征;计算所述新闻文本特征和OCR文本特征的文本相关性特征;并计算所述新闻文本特征及视觉融合特征的相似度特征;将所述新闻文本特征、OCR文本特征、图像的语义表示、文本相关性特征和相似度特征进行拼接,输入预先训练的分类器,获得目标新闻是否为假新闻的判别结果。

全文数据:

权利要求:

百度查询: 济南大学 基于相关性信息扩展的多模态虚假新闻识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。