买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种获取热度发生波动的热词的数据处理系统_北京睿企信息科技有限公司;日照睿安信息科技有限公司_202311300631.0 

申请/专利权人:北京睿企信息科技有限公司;日照睿安信息科技有限公司

申请日:2023-10-09

公开(公告)日:2024-04-05

公开(公告)号:CN117371435B

主分类号:G06F40/284

分类号:G06F40/284;G06F40/216

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2024.01.26#实质审查的生效;2024.01.09#公开

摘要:本发明提供了一种获取热度发生波动的热词的数据处理系统,包括:目标文本对应的关键特征词列表、预设热度波动特征词列表、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现如下步骤:获取第一特征相似度,当第一特征相似度不大于第一相似度阈值时,获取预设周期列表,根据目标关键词和预设周期列表获取第一关键词列表,将第一关键词作为第一字符串并删除第一字符串中的空格字符,以获取第二字符串,对第二字符串的长度进行对比,确定热度发生波动的热词,可知,本发明能够获取热度发生微小波动的热词,能够满足用户的需求,有利于提高在此需求下获取热词的精准度,使用户能够更深入的了解到事件的细节。

主权项:1.一种获取热度发生波动的热词的数据处理系统,其特征在于,所述系统包括:目标文本对应的关键特征词列表C={C1,C2,……,Cj,……,Cn}、预设热度波动特征词列表A1={A11,A12,……,A1i,……,A1m}、处理器和存储有计算机程序的存储器,其中,Cj为第j个关键特征词,j=1,2,……,n,n为关键特征词数量,A1i为第i个预设热度波动特征词,i=1,2,……,m,m为预设热度波动特征词数量,当计算机程序被处理器执行时,实现如下步骤:S1、根据C和A1,获取C和A1之间的第一特征相似度D1,其中,D1符合如下条件:D1=Σnj=1Σmi=1E1jim,E1ji为Cj与A1i对应的第一词语相似度,第一词语相似度为关键特征词与预设热度波动特征词之间的相似度;S2、当D1≤ΔD1时,获取预设周期列表T={T1,T2,……,Tg,……,Th},Tg={Tg1,Tg2,……,Tgr,……,Tgs},Tgr为第g个预设周期列表Tg中的第r个预设周期,g=1,2,……,h,h为预设周期列表数量,r=1,2,……,s,s为预设周期列表中的预设周期数量,ΔD1为第一相似度阈值;S3、根据目标关键词列表G和Tgr,获取Tgr对应的第一关键词列表Hgr,Hgr中包括若干个第一关键词,G={G1,G2,……,Gx,……,Gp},Gx为第x个目标关键词,x=1,2,……,p,p为目标关键词数量;S4、当T0gr∈[T1,T2]时,将Hgr中的第一关键词作为第一字符串,以获取第一字符串列表R={R1,R2,……,Rk,……,Rt},Rk为第k个第一字符串,k=1,2,……,t,t为第一字符串数量,其中,T1为第一预设周期长度,T2为第二预设周期长度;S5、将Rk中的空格字符删除,以获取Rk对应的第二字符串R0k;S6、当R1k>0时,将R0k作为热度发生波动的热词,其中,R1k为R0k的字符串长度。

全文数据:

权利要求:

百度查询: 北京睿企信息科技有限公司;日照睿安信息科技有限公司 一种获取热度发生波动的热词的数据处理系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。