买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于CNN的社交小众用户标签挖掘及相似用户推荐方法_重庆邮电大学_202010835019.3 

申请/专利权人:重庆邮电大学

申请日:2020-08-19

公开(公告)日:2022-07-12

公开(公告)号:CN112016003B

主分类号:G06F16/9536

分类号:G06F16/9536;G06F16/33;G06K9/62;G06N3/04;G06N3/08;G06Q50/00

优先权:

专利状态码:有效-授权

法律状态:2022.07.12#授权;2020.12.18#实质审查的生效;2020.12.01#公开

摘要:本发明涉及社交网络技术处理领域,具体涉及一种基于CNN的社交小众用户标签挖掘及相似用户推荐的方法,包括:获取用户在社交软件上发布的原始内容数据,预处理;通过word2vec模型获得词向量特征;将预处理后的内容数据输入到词嵌入层,每个词取其在word2vec中的位置,寻找对应每个词的词向量;获取用户的个人属性特征向量info,并将词向量特征与个人属性特征向量info相结合构成输入矩阵;将输入矩阵输入CNN模型,获得用户的话题标签;通过聚类算法构建社交网络图,输出与用户相似的群组或用户感兴趣的群组;对用户进行话题标签推荐和群组推荐。本发明解决了社交网络上信息较少的用户的话题推荐和相关群组推荐问题。

主权项:1.一种基于个性化CNN的社交网络普通小众用户代表性标签推荐方法,其特征在于,包括以下步骤:获取用户在社交软件上发布的原始内容数据,对原始内容数据进行预处理,得到预处理后的内容数据;将预处理后的内容数据输入到word2vec模型中,得到每一个句子中每个词的词向量表示,一个句子中每个词的词向量表示为: 其中,wordi表示第i个词,表示第i个词的向量表示,n表示一个句子共有n个词;取每个词在word2vec模型中对应的词向量进行拼接,获得一个句子的词向量特征矩阵,词向量特征矩阵表示如下: 其中,Sw表示词向量特征矩阵,en表示第n个词的向量表示,n表示Sw一共划分出n个词;获取用户的个人属性特征向量info,将词向量特征与用户的个人属性特征向量info相拼接,构成输入矩阵;将输入矩阵输入CNN模型,在CNN模型中通过卷积、池化、全连接层的计算,最终输出用户的代表性标签,即用户的话题标签;根据CNN模型输出的用户的代表性标签,通过聚类算法构建社交网络图,输出与用户相似的群组或用户感兴趣的群组,对用户进行话题标签推荐和群组推荐。

全文数据:

权利要求:

百度查询: 重庆邮电大学 基于CNN的社交小众用户标签挖掘及相似用户推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。