买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种面向新闻篇章的弱监督虚假文本片段过滤方法_中国人民解放军国防科技大学_202311682005.2 

申请/专利权人:中国人民解放军国防科技大学

申请日:2023-12-08

公开(公告)日:2024-04-09

公开(公告)号:CN117852537A

主分类号:G06F40/289

分类号:G06F40/289;G06F40/216;G06F18/213;G06F18/214;G06F18/22

优先权:

专利状态码:在审-公开

法律状态:2024.04.09#公开

摘要:本发明公开了信息处理技术领域的一种面向新闻篇章的弱监督虚假文本片段过滤方法,包括以下步骤:步骤一、获取待识别的新闻篇章并提取文本片段;步骤二、基于文本片段提取比对文本,并基于比对文本获取关联分词;步骤三、获取该待识别的新闻篇章的评论并提取训练文本,并基于训练文本或总关联分词和相似关联分词,基于两者的比例关系进行对比;步骤四、基于相似关联词得到评论情绪倾向,并基于比对文本得到比对文本情绪倾向,并将评论情绪倾向与比对文本情绪倾向进行一致性对比;将用户阅读新闻篇章后的评论内容联系起来,以此判断该新闻篇章的虚假性,以提高网络信息传播过程中新闻篇章的真实性。

主权项:1.一种面向新闻篇章的弱监督虚假文本片段过滤方法,其特征在于,包括以下步骤:步骤一、获取待识别的新闻篇章,将待识别的新闻篇章输入第一特征向量提取模型中,得到包含第一特征向量的文本片段,并基于前后顺序将文本片段进行排序,文本片段对应的序号为A1、A2、A3、...、An;步骤二、将各文本片段输入第二特征向量提取模型中,得到包含第二特征向量的比对文本,基于第二特征向量对比对文本进行关联度分析,得到该第二特征向量对应的关联分词,并将关联分词按文本片段的序号进行排序,得到第一训练集,第一训练集中的关联分词对应的序号顺序为B1、B2、B3、...、Bn;步骤三、获取该待识别的新闻篇章的评论,再将评论输入第二特征向量提取模型中,得到评论中包含第二特征向量的训练文本,基于第二特征向量对训练文本进行关联度分析,得到该训练文本中第二特征向量的总关联分词和相似关联分词;并计算相似关联分词与总关联分词的次数,得到相似关联分词与总关联分词之间的比例C,并将比例C与设定的比对比例进行对比,若比例C大于比对比例,则将该相似关联分词与比对文本中的关联分词进行对比,若一致,则获取该关联分词对应的比对文本,进入步骤四,若不一致,则将该比对文本情绪倾向输出为虚假文本并屏蔽该比对文本;若比例小于比对比例,则终止;步骤四、基于相似关联分词输入情绪向量提取模型中,得到评论情绪倾向,基于步骤三中的比对文本,得到该比对文本在第一训练集中对应的Bn,以及第一训练集中该Bn的前后顺序的Bn-1和Bn+1,并将Bn、Bn-1和Bn+1分别输入情绪向量提取模型中,得到比对文本情绪倾向,并将评论情绪倾向与比对文本情绪倾向进行一致性对比,若一致,则将该比对文本情绪倾向输出为虚假文本并屏蔽该比对文本,若不一致,则终止。

全文数据:

权利要求:

百度查询: 中国人民解放军国防科技大学 一种面向新闻篇章的弱监督虚假文本片段过滤方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。