申请/专利权人:新华网股份有限公司
申请日:2020-01-06
公开(公告)日:2023-11-24
公开(公告)号:CN111191037B
主分类号:G06F16/35
分类号:G06F16/35;G06F16/383;G06F40/279;G06F18/22
优先权:
专利状态码:有效-授权
法律状态:2023.11.24#授权;2020.06.16#实质审查的生效;2020.05.22#公开
摘要:本申请提出一种基于新闻评论的网络水军识别方法和装置,其中,方法包括:获取第一用户针对预设新闻事件发布的目标评论集,其中,目标评论集中包括多条评论及每条评论的发布时间;根据目标评论集中各条评论间的相似性,确定第一用户对应的第一文本相似度特征;根据预设新闻事件对应的参考时间窗口及第一用户的每条评论的发布时间,确定第一用户对应的信息熵特征;利用预设的模型,对第一用户对应的第一文本相似度特征及信息熵特征进行编码、解码处理,确定第一用户为水军的概率值。该方法通过提取用户发布的评论文本相似性特征,和可指示用户发布评论规律的信息熵特征,利用预设的模型对提取的特征进行处理,实现识别新闻评论中的水军。
主权项:1.一种基于新闻评论的网络水军识别方法,其特征在于,包括:获取第一用户针对预设新闻事件发布的目标评论集,其中,目标评论集中包括多条评论及每条评论的发布时间;根据所述目标评论集中各条评论间的相似性,确定所述第一用户对应的第一文本相似度特征;根据所述预设新闻事件对应的参考时间窗口及所述第一用户的每条评论的发布时间,确定所述第一用户对应的信息熵特征;利用预设的模型,对所述第一用户对应的第一文本相似度特征及信息熵特征进行编码、解码处理,确定所述第一用户为水军的概率值;所述根据所述预设新闻事件对应的参考时间窗口及所述第一用户的每条评论的发布时间,确定所述第一用户对应的信息熵特征,包括:根据所述预设新闻事件对应的参考时间窗口及所述第一用户的每条评论的发布时间,确定所述第一用户在每个参考时间窗口内发布的评论数量;根据所述第一用户在每个参考时间窗口内发布的评论数量,确定所述第一用户对应的评论序列;依据预设的算法,根据所述第一用户对应的评论序列,确定所述第一用户对应的信息熵特征。
全文数据:
权利要求:
百度查询: 新华网股份有限公司 基于新闻评论的网络水军识别方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。