买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】冷启动环境下的虚假评论检测方法_长沙理工大学_202110733235.1 

申请/专利权人:长沙理工大学

申请日:2021-06-29

公开(公告)日:2024-03-08

公开(公告)号:CN113392334B

主分类号:G06F16/9536

分类号:G06F16/9536;G06Q50/00;G06F16/35;G06F18/24;G06N3/042;G06N3/0464;G06N3/048;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.03.08#授权;2021.10.01#实质审查的生效;2021.09.14#公开

摘要:一种冷启动环境下的虚假评论检测方法,包括以下步骤:步骤1特征提取;步骤2异构图构建;步骤3基于图卷积的共享特征学习;步骤4特征融合与分类。通过本发明能够对冷启动环境下的虚假评论进性较为准确的判别。

主权项:1.一种冷启动环境下的虚假评论检测方法,其特征在于包括以下步骤:步骤1特征提取;步骤2异构图构建;步骤3基于图卷积的共享特征学习;步骤4特征融合与分类;其中:步骤1特征提取包括:对于所有用户评论,提取所有用户的行为特征以及所有产品的行为特征,并将它们分别作为用户节点以及产品节点的特征值;对于所有的用户实体u和产品实体p,行为特征值分别为:BFu={uMNR,uPR,uNR,uERD,uavgRD,uBST}1BFp={pMNR,pPR,pNR,pavgRD,pERD}2其中,BFu为用户实体的行为特征,BFp为产品实体的行为特征;uMNR为用户在一天内发表评论的最大数量;uPR为用户发布的所有评论中,正面评论所占的比例;uNR为用户发布的所有评论中,负面评论所占的比例;uERD为用户所发布评价分数的分布熵;uavgRD为平均偏差率;uBST为突发性;pMNR为产品在一天内收到评论的最大数量;pPR为产品收到的所有评论中,正面评论所占的比例;pNR为产品收到的所有评论中,负面评论所占的比例;pavgRD为平均偏差率;pERD为产品所得平均评价分数的分布熵;此外,对于每条评论,提取基于评论实体的行为特征BFr={Rank,RD,EXT,DEV,ISR}3Rank为评论的顺序;RD为评分偏差率的绝对值;EXT为评分的极值;DEV为基于β1阈值的评分偏差率,β1是通过递归最小熵划分学习到的;结合评论所对应用户的行为特征和对应产品的基于产品的行为特征,形成一个评论r的完整的行为特征向量qr,qr=[o1,o2,…,oj,…,o16]4预训练文本特征提取模型获得每条评论的文本特征,分类采用softmax激活函数:classTe=softmaxWTe·Ter+bTe5其中,Ter是评论文本r通过卷积得到的文本特征向量,WTe为可学习的权重矩阵,bTe表示偏差,classTe的取值用于表示分类为真实评论还是虚假评论;在训练好文本特征提取模型后,对于每条评论r使用基于CNN的文本特征提取模型得到的Ter作为该评论的文本特征向量;步骤2异构图构建包括:以用户实体和产品实体作为节点,以发布的评论和收到的评论作为边构建异构图;步骤3基于图卷积的共享特征学习包括:在构建好了异构图之后,对于图中的每条边,采用两层图卷积神经网络提取老用户对新用户的共享行为特征,卷积过程如公式6所示, 其中fs是每个关系s对应的卷积模块,AGG是聚合函数,表示关系s中源节点的特征,表示关系s中目标节点的特征;初始化时,根据如果节点类型为用户,则其初始特征值h为节点对应的用户特征BFu;如果节点类型为产品,则其特征值h为节点对应的产品特征BFp,l+1表示当前迭代次数,l表示此前的迭代次数,l的初始值为0;卷积模块fs由下式表示: 其中,Ni是节点i的邻居集,j是集合Ni中的元素,cji是节点度的平方根的乘积,即表示节点j经过l次迭代后的特征值,Wl表示可学习的权重,bl表示偏差,σ是激活函数;经过异构图上的卷积操作,得到每条边的源节点的隐藏特征值hsrc,和每条边的目标节点的隐藏特征值hdst;步骤4特征融合与分类包括:通过将评论原有的行为特征和文本特征与学习到的共享行为特征融合,生成冷启动评论的新的特征向量,将新的特征向量用于构建分类器,进行虚假评论的判别。

全文数据:

权利要求:

百度查询: 长沙理工大学 冷启动环境下的虚假评论检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。