买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】虚假评论检测模型训练方法、检测方法及装置_北京邮电大学_202011423884.3 

申请/专利权人:北京邮电大学

申请日:2020-12-08

公开(公告)日:2024-04-05

公开(公告)号:CN112463966B

主分类号:G06F16/35

分类号:G06F16/35;G06F40/216;G06F40/279;G06F40/30;G06Q30/0282;G06Q30/018;G06F18/214;G06F18/241;G06N3/0464;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2021.03.26#实质审查的生效;2021.03.09#公开

摘要:本发明提供一种虚假评论检测模型训练方法、检测方法及装置,所述训练方法中,基于训练样本集,在词向量库和情绪向量库中检索样本评论文本中的每个单词对应的词向量和情绪向量,将各词向量按照顺序连接成第一输入向量,将各情绪向量按照顺序连接成第二输入向量;初始网络模型利用第一卷积神经网络提取第一输入向量的语义特征向量,利用第二卷积神经网络提取第二输入向量的情绪特征向量,将语义特征向量、情绪特征向量、评论主体特征向量和被评论主体特征向量进行线性连接后,通过全连接层和激活函数进行分类;采用训练样本集对初始网络模型进行训练得到虚假评论检测模型。基于语义特征和情绪特征共同分析,以获得更准确的识别检测效果。

主权项:1.一种虚假评论检测模型训练方法,其特征在于,包括:获取多个样本评论文本,以及各样本评论文本对应的评论主体特征向量和被评论主体特征向量,并添加标签形成训练样本集;所述评论主体特征向量内的项包括评论主体的用户等级数、关注数量、粉丝数和或发表评论次数,所述被评论主体特征向量内的项包括被评论主体对应的被评论数、好评率和或评论用户平均星级数;所述训练样本集中的数据是基于预设资源定位符对应的网络页面进行数据爬取得到的;在词向量库和情绪向量库中检索所述样本评论文本中的每个单词对应的词向量和情绪向量,将各词向量按照顺序连接成第一输入向量,将各情绪向量按照顺序连接成第二输入向量;其中,若所述词向量库中缺乏一单词的词向量,则采用未知词标识替代该单词的词向量;若所述情绪向量库中缺乏一单词的情绪向量,则采用未知情绪标识代替该单词的情绪向量;所述词向量库是采用Word2Vec模型对所述样本评论文本中的每个单词进行词嵌入操作得到的;获取初始网络模型,所述初始网络模型利用第一卷积神经网络提取所述第一输入向量的语义特征向量,利用第二卷积神经网络提取所述第二输入向量的情绪特征向量,将所述语义特征向量、所述情绪特征向量、所述评论主体特征向量和所述被评论主体特征向量进行线性连接后,通过全连接层和激活函数进行分类;基于交叉熵损失函数,采用所述训练样本集对所述初始网络模型进行训练得到虚假评论检测模型。

全文数据:

权利要求:

百度查询: 北京邮电大学 虚假评论检测模型训练方法、检测方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。