买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于联合对比学习的隐式仇恨言论检测及细分类方法、装置_中国人民解放军国防科技大学_202310349777.8 

申请/专利权人:中国人民解放军国防科技大学

申请日:2023-04-04

公开(公告)日:2023-06-23

公开(公告)号:CN116303995A

主分类号:G06F16/335

分类号:G06F16/335;G06F16/338;G06F16/35;G06N3/0464;G06N3/08;G06F18/241;G06Q50/00

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.07.11#实质审查的生效;2023.06.23#公开

摘要:本发明公开了基于联合对比学习的隐式仇恨言论检测及细分类方法、装置,其可以检测社交媒体中的仇恨言论并进行细分类,为网络空间言论治理提供决策支持,采集在线社交媒体中的文本数据,构建并训练隐式仇恨言论检测模型,获取隐式仇恨言论,基于常识知识库ATOMIC进行知识增强,推理出文本发文者的意图、主体反应以及阅读者的客体反应;构建并优化隐式仇恨言论分类模型,分别将同类别的隐式仇恨言论、意图、主体反应以及客体反应作为对比学习中的正样本计算对比学习损失,加权求和得到联合对比学习损失,与交叉熵损失求和得到总损失函数,优化总损失函数,通过训练好的隐式仇恨言论分类模型获得隐式仇恨言论的分类结果,用于社交媒体言论治。

主权项:1.一种基于联合对比学习的隐式仇恨言论检测及细分类方法,其特征在于,包括以下步骤:步骤1:采集在线社交媒体中的文本数据,对采集的文本数据进行数据清洗和数据预处理;步骤2:构建隐式仇恨言论检测模型,所述隐式仇恨言论检测模型包括预训练语言模型模块和全连接网络模块,所述预训练语言模型模块用于提取文本特征,所述全连接网络模块用于对提取的文本特征进行分类,采用有标签数据集对隐式仇恨言论检测模型进行训练,完成训练的隐式仇恨言论检测模型能够区分文本数据中的非仇恨言论、显式仇恨言论以及隐式仇恨言论,将采集的文本数据输入完成训练的隐式仇恨言论检测模型,得到隐式仇恨言论;步骤3:针对检测出的隐式仇恨言论,基于常识知识库ATOMIC对隐式仇恨文本进行知识增强,推理出文本发文者的意图、发文者的主体反应以及阅读者的客体反应;步骤4:构建隐式仇恨言论分类模型,所述隐式仇恨言论分类模型包括预训练语言模型模块和全连接网络模块,所述预训练语言模型模块用于提取特征,所述全连接网络模块用于对提取的特征进行分类;使用对比学习框架,分别将同类别的隐式仇恨言论、意图、主体反应以及客体反应作为对比学习中的正样本计算对比学习损失,并将四种对比学习损失联合加权求和得到联合对比学习损失;将联合对比学习损失与交叉熵损失求和得到隐式仇恨言论分类模型的总损失函数,优化隐式仇恨言论分类模型的总损失函数,得到训练好的隐式仇恨言论分类模型;步骤5:将检测到的隐式仇恨言论输入训练好的隐式仇恨言论分类模型,输出隐式仇恨言论的分类结果,所述隐式仇恨言论的分类结果用于社交媒体言论治理。

全文数据:

权利要求:

百度查询: 中国人民解放军国防科技大学 基于联合对比学习的隐式仇恨言论检测及细分类方法、装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。