首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】作者的兴趣主题的分析方法、装置、电子设备及存储介质_北京工业大学_202011625275.6 

申请/专利权人:北京工业大学

申请日:2020-12-31

公开(公告)日:2024-05-14

公开(公告)号:CN112765305B

主分类号:G06F16/31

分类号:G06F16/31;G06F40/284

优先权:

专利状态码:有效-授权

法律状态:2024.05.14#授权;2021.05.25#实质审查的生效;2021.05.07#公开

摘要:本申请实施例提供了一种作者的兴趣主题的分析方法、装置、电子设备及存储介质,涉及信息分析技术领域。该方法包括:获取目标领域的至少一篇文献,确定文献中每个作者的贡献权重,每个单词在文献中表达的主题以及文献中每个作者负责的单词;根据每个单词在文献中表达的主题、文献中每个作者负责的单词以及文献中每个作者的贡献权重,得到文献中每个作者表达的主题,根据作者在相关文献负责的内容所表达的主题,确定作者的兴趣主题。本申请实施例能够考虑每一位共同作者对一篇多作者文章贡献不等的前提下,发现各作者的兴趣主题,合理反映科研人员的兴趣主题,有助于发掘学科领域的研究热点及趋势,并推进个性化学术研究。

主权项:1.一种作者的兴趣主题的分析方法,其特征在于,包括:获取目标领域的至少一篇文献,通过确定预设的贡献权重算法中的参数,确定所述文献中每个作者的贡献权重;所述贡献权重为所述作者的贡献值的归一化结果;对于每一篇文献,确定所述文献中每个单词在所述文献中表达的主题,以及所述文献中每个作者负责的单词;根据所述每个单词在所述文献中表达的主题、所述文献中每个作者负责的单词以及所述文献中每个作者的贡献权重,得到所述文献中每个作者表达的主题;对于每个作者,从所述至少一篇文献中确定所述作者负责的相关文献,获取所述作者在相关文献负责的内容所表达的主题,以确定所述作者的兴趣主题;所述确定所述文献中每个作者的贡献权重,包括:获取所述文献中作者和每个作者的贡献值;根据所述文献中作者的数目和每个作者的贡献值,确定每个作者的初始权重;将所述文献中每个作者的初始权重进行归一化,得到所述文献中每个作者的最终权重;所述根据所述每个单词在所述文献中表达的主题、所述文献中每个作者负责的单词以及所述文献中每个作者的贡献权重,得到所述文献中每个作者负责的内容所表达的主题,包括:对于所述文献中任意一个作者,根据所述作者的最终权重,选取单词在所述文献中表达的主题和所述文献中作者负责的单词;将所述作者负责的单词作为目标单词,根据所述目标单词在所述文献中表达的主题,确定所述作者在所述文献中所述表达的主题;所述单词在所述文献中表达的主题和所述文献中作者负责的单词通过吉布斯采样算法公式获得,所述吉布斯采样算法公式为: 其中,Pr表示条件概率,表示目标文献中的单词向量,ωm,n表示目标文献m中第n个单词,表示分配给目标文献m中第n个单词的主题以外的所有主题向量,zm,n表示目标文献m中第n个单词的主题,表示分配给目标文献m中第n个单词的作者以外的所有作者向量,xm,n表示目标文献m中第n个单词的作者,表示目标文献的作者变量,表示目标文献中各个作者的权重向量,λ是计算目标文献作者权重的参量,K表示目标文献内容的主题数量,ωm,n表示目标文献m中第n个单词,V表示处理后的文本信息中单词的数量,指代的是目标文献m中第n个单词被分配zm,n主题的次数,的狄利克雷先验参数向量,表示目标文献m中第n个单词的主题参量,是中的元素,-1表示不考虑当前一次被分配的次数,表示求和所有单词v被分配主题zm,n的次数和所有单词的主题参量,表示目标文献m中第n个单词被同时分配zm,n主题和作者xm,n的次数,是狄利克雷先验参数向量,表示目标文献m中第n个单词的主题zm,n的作者参量,是中的元素,表示求和所有被同时分配主题k和作者xm,n的次数和所有主题k的作者参量α,表示目标文献m中作者xm,n的贡献权重。

全文数据:

权利要求:

百度查询: 北京工业大学 作者的兴趣主题的分析方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。