买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于语言大模型和视觉编码器的多模态网络谣言检测方法_福州大学_202311792049.0 

申请/专利权人:福州大学

申请日:2023-12-25

公开(公告)日:2024-03-26

公开(公告)号:CN117763421A

主分类号:G06F18/241

分类号:G06F18/241;G06F18/25;G06V20/62;G06V10/82;G06N3/0499;G06N3/0455

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.12#实质审查的生效;2024.03.26#公开

摘要:本发明提供一种基于语言大模型和视觉编码器的多模态网络谣言检测方法,首先获取网络谣言检测数据集,将其中所有图片通过光学字符识别模型提取为文本,然后把查询文本、证据文本、从图片中提取的文本分别输入语言大模型得到对应的文本特征序列向量,把查询图片、证据图片分别输入视觉编码器得到对应的图片特征向量。通过多头注意力机制,计算查询信息对证据信息的注意力分数,并将其作为权重重新计算证据信息。随后将每条文本特征序列按序列长度维度取其平均值作为代表信息,最后将图片特征向量、请查询本特征向量、证据文本特征向量拼接,输入多层感知机后得出分类结果。

主权项:1.一种基于语言大模型和视觉编码器的多模态网络谣言检测方法,其特征在于,包括以下步骤:步骤S1:获取网络谣言检测数据集,使用光学字符识别模型将数据集中图片内含文字提取为可处理的文本;步骤S2:使用经过预训练的带有编码功能的语言大模型,将查询文本、证据文本以及从图片中提取的文本分别输入语言大模型提取文本序列特征向量,并将请求图片、证据图片分别输入视觉编码器模型,得到对应图片特征向量;步骤S3:使用注意力机制,计算所有查询信息对证据信息的注意力分数,并根据注意力分数作为权重重新计算证据信息;步骤S4:将查询信息与经过注意力机制计算的证据信息的特征向量按序列长度维度取平均值作为代表信息,并且将其拼接为单条向量,将其输入到多层感知机中,得到分类分数,最后得出分类结果。

全文数据:

权利要求:

百度查询: 福州大学 一种基于语言大模型和视觉编码器的多模态网络谣言检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。