【发明公布】一种面向新闻篇章的弱监督虚假文本片段过滤方法_中国人民解放军国防科技大学_202311682005.2

申请/专利权人：中国人民解放军国防科技大学

申请日：2023-12-08

公开（公告）日：2024-04-09

公开（公告）号：CN117852537A

主分类号：G06F40/289

分类号：G06F40/289;G06F40/216;G06F18/213;G06F18/214;G06F18/22

优先权：

专利状态码：在审-公开

法律状态：2024.04.09#公开

摘要：本发明公开了信息处理技术领域的一种面向新闻篇章的弱监督虚假文本片段过滤方法，包括以下步骤：步骤一、获取待识别的新闻篇章并提取文本片段；步骤二、基于文本片段提取比对文本，并基于比对文本获取关联分词；步骤三、获取该待识别的新闻篇章的评论并提取训练文本，并基于训练文本或总关联分词和相似关联分词，基于两者的比例关系进行对比；步骤四、基于相似关联词得到评论情绪倾向，并基于比对文本得到比对文本情绪倾向，并将评论情绪倾向与比对文本情绪倾向进行一致性对比；将用户阅读新闻篇章后的评论内容联系起来，以此判断该新闻篇章的虚假性，以提高网络信息传播过程中新闻篇章的真实性。

主权项：1.一种面向新闻篇章的弱监督虚假文本片段过滤方法，其特征在于，包括以下步骤：步骤一、获取待识别的新闻篇章，将待识别的新闻篇章输入第一特征向量提取模型中，得到包含第一特征向量的文本片段，并基于前后顺序将文本片段进行排序，文本片段对应的序号为A1、A2、A3、...、An；步骤二、将各文本片段输入第二特征向量提取模型中，得到包含第二特征向量的比对文本，基于第二特征向量对比对文本进行关联度分析，得到该第二特征向量对应的关联分词，并将关联分词按文本片段的序号进行排序，得到第一训练集，第一训练集中的关联分词对应的序号顺序为B1、B2、B3、...、Bn；步骤三、获取该待识别的新闻篇章的评论，再将评论输入第二特征向量提取模型中，得到评论中包含第二特征向量的训练文本，基于第二特征向量对训练文本进行关联度分析，得到该训练文本中第二特征向量的总关联分词和相似关联分词；并计算相似关联分词与总关联分词的次数，得到相似关联分词与总关联分词之间的比例C，并将比例C与设定的比对比例进行对比，若比例C大于比对比例，则将该相似关联分词与比对文本中的关联分词进行对比，若一致，则获取该关联分词对应的比对文本，进入步骤四，若不一致，则将该比对文本情绪倾向输出为虚假文本并屏蔽该比对文本；若比例小于比对比例，则终止；步骤四、基于相似关联分词输入情绪向量提取模型中，得到评论情绪倾向，基于步骤三中的比对文本，得到该比对文本在第一训练集中对应的Bn,以及第一训练集中该Bn的前后顺序的Bn-1和Bn+1，并将Bn、Bn-1和Bn+1分别输入情绪向量提取模型中，得到比对文本情绪倾向，并将评论情绪倾向与比对文本情绪倾向进行一致性对比，若一致，则将该比对文本情绪倾向输出为虚假文本并屏蔽该比对文本，若不一致，则终止。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学一种面向新闻篇章的弱监督虚假文本片段过滤方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种工业废水资源再生系统及其工艺_苏州西姆提纳米科技有限公司_202410248723.7

下一篇：端子排接线装置_南方电网储能股份有限公司西部检修试验分公司_202410258351.6

相关技术

一种工业废水资源再生系统及其工艺_苏州西姆提纳米科技有限公司_202410248723.7

端子排接线装置_南方电网储能股份有限公司西部检修试验分公司_202410258351.6

一种可切换状态的水枪_正阳科技股份有限公司_202410398561.5

业务处理方法、设备及存储介质_荣耀终端有限公司_202211403113.7

一种毫米波雷达干扰抑制方法、装置、雷达设备及车辆_福思(杭州)智能科技有限公司_202410422447.1

一种槽腔组合式的斜齿轮辐板_厦门大学_202410307672.0

自支撑电极及其制备方法和钠离子电池_宁波容百新能源科技股份有限公司_202410420040.5

基于边缘先验与注意力机制相结合的图像修复方法、装置、设备以及可读存储介质_西藏民族大学_202311365706.3

取代的吡啶并嘧啶酮类化合物及包含该化合物的组合物及其用途_深圳市塔吉瑞生物医药有限公司_202310418144.8

复合信息化集装箱区多功能辅助系统和方法_布勒(无锡)商业有限公司_202410215960.3

一种机车车辆及动车组故障精准诊断方法和系统_中车大连机车车辆有限公司_202410309149.1

句法语言模型的无监督训练方法及装置_支付宝(杭州)信息技术有限公司_202410296243.8

龙图腾网&IPTOP

【发明公布】一种面向新闻篇章的弱监督虚假文本片段过滤方法_中国人民解放军国防科技大学_202311682005.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务