买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种联想词的推荐方法、装置、电子设备及存储介质_北京百度网讯科技有限公司_201910537464.9 

申请/专利权人:北京百度网讯科技有限公司

申请日:2019-06-20

公开(公告)日:2021-09-24

公开(公告)号:CN110276009B

主分类号:G06F16/9535(20190101)

分类号:G06F16/9535(20190101);G06F40/30(20200101)

优先权:

专利状态码:有效-授权

法律状态:2021.09.24#授权;2019.10.22#实质审查的生效;2019.09.24#公开

摘要:本发明实施例公开了一种联想词的推荐方法、装置、电子设备及存储介质。所述方法包括:接收用户输入的搜索词;根据预先计算的所述搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取所述搜索词对应的联想词;将所述搜索词对应的联想词推荐给所述用户。在本发明的实施例中,不仅可以向用户推荐更多且更有写作价值的联想词,而且还可以满足用户对推荐信息的实时性要求。

主权项:1.一种联想词的推荐方法,其特征在于,所述方法包括:接收用户输入的搜索词;若在各个中心词组中查找到与所述搜索词相同的第一中心词,在各个中心词组中获取出第二中心词作为所述搜索词对应的联想词;若在各个中心词组中查找到与所述搜索词相同的第二中心词,在各个中心词组中获取出第一中心词作为所述搜索词对应的联想词;其中,各个实时资讯素材包括至少一个中心词组,所述中心词组包括:第一中心词与第二中心词;所述第一中心词和所述第二中心词之间的关系包括谓词逻辑关系和非谓词逻辑关系;将所述搜索词对应的联想词推荐给所述用户。

全文数据:一种联想词的推荐方法、装置、电子设备及存储介质技术领域本发明实施例涉及数据处理技术领域,尤其涉及一种联想词的推荐方法、装置、电子设备及存储介质。背景技术随着互联网技术的发展,为了满足互联网用户对不同领域信息的获取需求,搜索引擎接收到用户输入的搜索关键词,通常会对该搜索关键词进行联想,推荐相关的联想词给用户。在目前绝大部分的搜索引擎中,默认搜索类别是网页搜索,网页搜索是指根据用户的搜索请求对所有网络资源都进行与用户意图搜索的词条相关的搜索。为了避免用户输入较长的搜索词,搜索引擎为用户提供了搜索提示功能,即在用户输入搜索词的前缀或者后缀的过程中,搜索引擎为用户提示多个常用搜索词,用户通过选择确定操作就会直接进行常用搜索词的在线搜索。在现有的联想词的推荐方法中,首先需要在后台数据库中为用户要搜索的数据源建立索引,在用户输入搜索词之后,将用户输入的搜索词作为前缀在后台数据库的索引文件中进行查找,得到以搜索词为前缀的多个关联词,搜索引擎将查找到的多个关联词作为提示用户的常用搜索词。例如,当用户在搜索引擎的搜索栏中输入“新浪”时,将用户输入的“新浪”作为前缀在用户要搜索的数据源所在的后台数据库中进行查找,得到以“新浪”为前缀的多个关联词:“新浪新闻”、“新浪短信”、“新浪体育”、“新浪邮件”、“新浪科技”、“新浪财经”,将多个关联词作为提示用户的常用搜索词。在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:在现有的联想词的推荐方法中,基于用户的搜索词召回关联词,这样召回的关联词仅满足用户的搜索需求,不具备可写作的价值;另外,现有的搜索引擎在生成联想词时需要依赖用户搜索,而且通常在新闻发生后一段时间才会产生,时效性比较低,不能满足用户对推荐信息的实时性要求。发明内容有鉴于此,本发明实施例提供一种联想词的推荐方法、装置、电子设备及存储介质,不仅可以向用户推荐更多且更有写作价值的联想词,而且还可以满足用户对推荐信息的实时性要求。第一方面,本发明实施例提供了一种联想词的推荐方法,所述方法包括:接收用户输入的搜索词;根据预先计算的所述搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取所述搜索词对应的联想词;将所述搜索词对应的联想词推荐给所述用户。在上述实施例中,在所述接收用户输入的搜索词之前,所述方法还包括:在各个实时资讯素材中抽取出至少两个中心词;其中,各个实时资讯素材按照垂类领域归档或者按照非垂类领域归档;将各个实时资讯素材中的每两个中心词组合为一个中心词组;其中,所述中心词组包括:第一中心词与第二中心词;计算各个中心词组中的所述第一中心词与所述第二中心词之间的关联度。在上述实施例中,所述计算各个中心词组中的第一中心词与第二中心词之间的关联度,包括:根据各个中心词组中的第一中心词与第二中心词,确定被抽取出所述第一中心词且被抽取出所述第二中心词的目标资讯素材;获取所述目标资讯素材被点击的次数或者被评论的数量;根据所述目标资讯素材被点击的次数或者被评论的数量以及预先确定的所述第一中心词与所述第二中心词之间的关系,计算出所述第一中心词与所述第二中心词之间的关联度。在上述实施例中,所述根据预先计算的所述搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取所述搜索词对应的联想词,包括:若在各个中心词组中查找到与所述搜索词相同的第一中心词,在各个中心词组中获取出所述第二中心词作为所述搜索词对应的联想词;若在各个中心词组中查找到与所述搜索词相同的第二中心词,在各个中心词组中获取出所述第一中心词作为所述搜索词对应的联想词。在上述实施例中,在所述将所述搜索词对应的联想词推荐给所述用户之前,所述方法还包括:对所述搜索词以及所述搜索词对应的联想词进行语义分析;根据所述搜索词的语义分析结果以及所述搜索词对应的联想词的语义分析结果,对所述搜索词以及所述搜索词对应的联想词进行过滤。在上述实施例中,所述将所述搜索词对应的联想词推荐给所述用户,包括:根据所述搜索词与各个联想词之间的关联度,按照关联度由高到低的顺序将所述搜索词对应的联想词进行排序;将排序后的所述搜索词对应的联想词推荐给所述用户。。第二方面,本发明实施例提供了一种联想词的推荐装置,所述装置包括:接收模块、获取模块和推荐模块;其中,所述接收模块,用于接收用户输入的搜索词;所述获取模块,用于根据预先计算的所述搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取所述搜索词对应的联想词;所述推荐模块,用于将所述搜索词对应的联想词推荐给所述用户。在上述实施例中,所述装置还包括:抽取模块和计算模块;其中,所述抽取模块,用于在各个实时资讯素材中抽取出至少两个中心词;其中,各个实时资讯素材按照垂类领域归档或者按照非垂类领域归档;将各个实时资讯素材中的每两个中心词组合为一个中心词组;其中,所述中心词组包括:第一中心词与第二中心词;所述计算模块,用于计算各个中心词组中的所述第一中心词与所述第二中心词之间的关联度。在上述实施例中,所述计算模块,具体用于根据各个中心词组中的第一中心词与第二中心词,确定被抽取出所述第一中心词且被抽取出所述第二中心词的目标资讯素材;获取所述目标资讯素材被点击的次数或者被评论的数量;根据所述目标资讯素材被点击的次数或者被评论的数量以及预先确定的所述第一中心词与所述第二中心词之间的关系,计算出所述第一中心词与所述第二中心词之间的关联度。在上述实施例中,所述获取模块,具体用于若在各个中心词组中查找到与所述搜索词相同的第一中心词,在各个中心词组中获取出所述第二中心词作为所述搜索词对应的联想词;若在各个中心词组中查找到与所述搜索词相同的第二中心词,在各个中心词组中获取出所述第一中心词作为所述搜索词对应的联想词。在上述实施例中,所述推荐模块,还用于对所述搜索词以及所述搜索词对应的联想词进行语义分析;根据所述搜索词的语义分析结果以及所述搜索词对应的联想词的语义分析结果,对所述搜索词以及所述搜索词对应的联想词进行过滤。在上述实施例中,所述推荐模块包括:排序子模块和推荐子模块;其中,所述排序子模块,用于根据所述搜索词与各个联想词之间的关联度,按照关联度由高到低的顺序将所述搜索词对应的联想词进行排序;所述推荐子模块,用于将排序后的所述搜索词对应的联想词推荐给所述用户。第三方面,本发明实施例提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的联想词的推荐方法。第四方面,本发明实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的联想词的推荐方法。本发明实施例提出了一种联想词的推荐方法、装置、电子设备及存储介质,先接收用户输入的搜索词;然后根据预先计算的搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取搜索词对应的联想词;再将搜索词对应的联想词推荐给用户。也就是说,在本发明的技术方案中,可以预先计算出搜索词与各个实时资讯素材中的各个中心词之间的关联度,这样就可以在接收到用户输入的搜索词之后,即刻在联想词库中获取到搜索词对应的联想词,从而将搜索词对应的联想词推荐给用户。而在现有的联想词的推荐方法中,基于用户的搜索词召回关联词,这样召回的关联词仅满足用户的搜索需求,不具备可写作的价值;另外,现有的搜索引擎在生成联想词时需要依赖用户搜索,而且通常在新闻发生后一段时间才会产生,时效性比较低,不能满足用户对推荐信息的实时性要求。因此,和现有技术相比,本发明实施例提出的联想词的推荐方法、装置、电子设备及存储介质,不仅可以向用户推荐更多且更有写作价值的联想词,而且还可以满足用户对推荐信息的实时性要求;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。附图说明图1为本发明实施例一提供的联想词的推荐方法的流程示意图;图2为本发明实施例二提供的联想词的推荐方法的流程示意图;图3为本发明实施例三提供的联想词的推荐方法的流程示意图;图4为本发明实施例四提供的联想词的推荐装置的第一结构示意图;图5为本发明实施例四提供的联想词的推荐装置的第二结构示意图;图6为本发明实施例五提供的电子设备的结构示意图。具体实施方式下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。实施例一图1为本发明实施例一提供的联想词的推荐方法的流程示意图,该方法可以由联想词的推荐装置或者电子设备来执行,该装置或者电子设备可以由软件和或硬件的方式实现,该装置或者电子设备可以集成在任何具有网络通信功能的智能设备中。如图1所示,联想词的推荐方法可以包括以下步骤:S101、接收用户输入的搜索词。在本发明的具体实施例中,电子设备可以接收用户输入的搜索词。具体地,电子设备可以接收用户通过搜素引擎输入的搜素词,搜索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。S102、根据预先计算的搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取搜索词对应的联想词。在本发明的具体实施例中,电子设备可以根据预先计算的搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取搜索词对应的联想词。具体地,电子设备在接收用户输入的搜索词之前,还可以先在各个实时资讯素材中抽取出至少两个中心词;其中,各个实时资讯素材按照垂类领域归档或者按照非垂类领域归档;然后将各个实时资讯素材中的每两个中心词组合为一个中心词组;其中,中心词组包括:第一中心词与第二中心词;再计算各个中心词组中的第一中心词与第二中心词之间的关联度。例如,实时资讯素材可以包括:娱乐类的实时资讯素材、体育类的实时资讯素材、新闻类的实时资讯素材、财经类的实时资讯素材。在本步骤中,电子设备可以分别在娱乐类的实时资讯素材、体育类的实时资讯素材、新闻类的实时资讯素材、财经类的实时资讯素材中抽取出至少两个中心词。假设电子设备在娱乐类的实时资讯素材中抽取出三个中心词,分别为:中心词A、中心词B和中心词C;然后电子设备可以根据中心词A、中心词B和中心词C组合为三个中心词组,分别为:中心词组1、中心词组2和中心词组3;其中,中心词组1包括:第一中心词中心词A和第二中心词中心词B;中心词组2包括:第一中心词中心词B和第二中心词中心词C;中心词组3包括:第一中心词中心词A和第二中心词中心词C。电子设备可以分别计算中心词A和中心词B之间的关联度、中心词B和中心词C之间的关联度;中心词A和中心词C之间的关联度。S103、将搜索词对应的联想词推荐给用户。在本发明的具体实施例中,电子设备可以将搜索词对应的联想词推荐给用户。较佳地,电子设备在将搜索词对应的联想词推荐给用户之前,还可以先对搜索词以及搜索词对应的联想词进行语义分析;然后根据搜索词的语义分析结果以及搜索词对应的联想词的语义分析结果,对搜索词以及搜索词对应的联想词进行过滤。具体地,若搜索词的语义分析结果为合法的搜索词,并且,联想词的语义分析结果为合法的联想词,电子设备可以将搜索词对应的联想词推荐给用户。若搜索词的语义分析结果为不合法的搜索词,或者,联想词的语义分析结果为不合法的联想词,电子设备不会将搜索词对应的联想词推荐给用户。具体地,搜索词的语义分析结果为:搜索词涉政、涉黄、涉恐、涉暴,那么该搜索词为不合法的搜索词;同样地,联想词的语义分析结果为:搜索词涉政、涉黄、涉恐、涉暴,那么该联想词为不合法的联想词。较佳地,在本发明的具体实施例中,电子设备可以根据搜索词与各个联想词之间的关联度,按照关联度由高到低的顺序将搜索词对应的联想词进行排序;然后将排序后的搜索词对应的联想词推荐给用户。本发明实施例提出的联想词的推荐方法,先接收用户输入的搜索词;然后根据预先计算的搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取搜索词对应的联想词;再将搜索词对应的联想词推荐给用户。也就是说,在本发明的技术方案中,可以预先计算出搜索词与各个实时资讯素材中的各个中心词之间的关联度,这样就可以在接收到用户输入的搜索词之后,即刻在联想词库中获取到搜索词对应的联想词,从而将搜索词对应的联想词推荐给用户。而在现有的联想词的推荐方法中,基于用户的搜索词召回关联词,这样召回的关联词仅满足用户的搜索需求,不具备可写作的价值;另外,现有的搜索引擎在生成联想词时需要依赖用户搜索,而且通常在新闻发生后一段时间才会产生,时效性比较低,不能满足用户对推荐信息的实时性要求。因此,和现有技术相比,本发明实施例提出的联想词的推荐方法,不仅可以向用户推荐更多且更有写作价值的联想词,而且还可以满足用户对推荐信息的实时性要求;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。实施例二图2为本发明实施例二提供的联想词的推荐方法的流程示意图。如图2所示,联想词的推荐方法可以包括以下步骤:S201、在各个实时资讯素材中抽取出至少两个中心词;其中,各个实时资讯素材按照垂类领域归档或者按照非垂类领域归档。在本发明的具体实施例中,电子设备可以在各个实时资讯素材中抽取出至少两个中心词;其中,各个实时资讯素材按照垂类领域归档或者按照非垂类领域归档。具体地,垂类领域指的是处于同一个分类级别中且相互独立的各个资讯领域,例如,娱乐类资讯领域、体育类资讯领域、新闻类资讯领域、财经类资讯领域;非垂类领域指的是处于不同的分类级别中且相互包含的各个资讯领域。例如,新闻类资讯领域可以进一步划分为国内新闻类资讯领域和国际新闻类资讯领域。在本发明的具体实施例中,实时资讯素材可以为某一个资讯领域中的资讯素材,也可以为多个资讯领域的资讯素材。例如,实时资讯素材可以包括:娱乐类的实时资讯素材、体育类的实时资讯素材、新闻类的实时资讯素材、财经类的实时资讯素材。在本步骤中,电子设备可以分别在娱乐类的实时资讯素材、体育类的实时资讯素材、新闻类的实时资讯素材、财经类的实时资讯素材中抽取出至少两个中心词。S202、将各个实时资讯素材中的每两个中心词组合为一个中心词组;其中,中心词组包括:第一中心词与第二中心词。在本发明的具体实施例中,电子设备可以将各个实时资讯素材中的每两个中心词组合为一个中心词组;其中,中心词组包括:第一中心词与第二中心词。假设电子设备在娱乐类的实时资讯素材中抽取出三个中心词,分别为:中心词A、中心词B和中心词C;然后电子设备可以根据中心词A、中心词B和中心词C组合为三个中心词组,分别为:中心词组1、中心词组2和中心词组3;其中,中心词组1包括:第一中心词中心词A和第二中心词中心词B;中心词组2包括:第一中心词中心词B和第二中心词中心词C;中心词组3包括:第一中心词中心词A和第二中心词中心词C。S203、计算各个中心词组中的第一中心词与第二中心词之间的关联度。在本发明的具体实施例中,电子设备可以计算各个中心词组中的第一中心词与第二中心词之间的关联度。具体地,电子设备可以先根据各个中心词组中的第一中心词与第二中心词,确定被抽取出第一中心词且被抽取出第二中心词的目标资讯素材;然后获取目标资讯素材被点击的次数或者被评论的数量;再根据目标资讯素材被点击的次数或者被评论的数量以及预先确定的第一中心词与第二中心词之间的关系,计算出第一中心词与第二中心词之间的关联度。例如,对于中心词A和中心词B,电子设备可以先确定被抽取出中心词A且被抽取出中心词B的目标资讯素材,假设该目标资讯素材被点击的次数为1000,中心词A与中心词B之间的关系为谓词逻辑的关系,电子设备可以计算出中心词A与中心词B之间的关联度为80%;假设目标资讯素材被点击的次数为10,中心词A与中心词B之间的关系为非谓词逻辑的关系,电子设备可以计算出中心词A与中心词B之间的关联度为40%。具体地,在谓词逻辑中,原子命题分解成个体词和谓词。个体词是可以独立存在的事或物,包括现实物、精神物和精神事三种;谓词则是用来刻划个体词的性质的词,即刻画事和物之间的某种关系表现的词。如“苹果”是一个现实物个体词,"苹果可以吃"是一个原子命题,“可以吃”是谓词,刻划“苹果”的一个性质,即与动物或人的一个关系。这里,第一中心词与第二中心词之间的关联度是一个相对值,关联度的大小可以表示出第一中心词与第二中心词之间的关联程度;关联度越高,表示第一中心词与第二中心词之间的关系越紧密;关联度越低,表示第一中心词与第二中心词之间的关系越疏远。S204、接收用户输入的搜索词。在本发明的具体实施例中,电子设备可以接收用户输入的搜索词。具体地,电子设备可以接收用户通过搜素引擎输入的搜素词。S205、若在各个中心词组中查找到与搜索词相同的第一中心词,在各个中心词组中获取出第二中心词作为搜索词对应的联想词;若在各个中心词组中查找到与搜索词相同的第二中心词,在各个中心词组中获取出第一中心词作为搜索词对应的联想词。在本发明的具体实施例中,若电子设备在各个中心词组中查找到与搜索词相同的第一中心词,电子设备可以在各个中心词组中获取出第二中心词作为搜索词对应的联想词;若电子设备在各个中心词组中查找到与搜索词相同的第二中心词,电子设备可以在各个中心词组中获取出第一中心词作为搜索词对应的联想词。例如,假设某个中心词组包括:中心词A和中心词B;电子设备接收用户输入的搜索词为中心词A,在本步骤中,电子设备可以在该中心词组中获取出中心词B作为搜索词对应的联想词。假设某个中心词组包括:中心词A和中心词C;电子设备接收用户输入的搜索词为中心词C,在本步骤中,电子设备可以在该中心词组中获取出中心词A作为搜索词对应的联想词。S206、将搜索词对应的联想词推荐给用户。在本发明的具体实施例中,电子设备可以将搜索词对应的联想词推荐给用户。较佳地,电子设备在将搜索词对应的联想词推荐给用户之前,还可以先对搜索词以及搜索词对应的联想词进行语义分析;然后根据搜索词的语义分析结果以及搜索词对应的联想词的语义分析结果,对搜索词以及搜索词对应的联想词进行过滤。具体地,若搜索词的语义分析结果为合法的搜索词,并且,联想词的语义分析结果为合法的联想词,电子设备可以将搜索词对应的联想词推荐给用户。若搜索词的语义分析结果为不合法的搜索词,或者,联想词的语义分析结果为不合法的联想词,电子设备不会将搜索词对应的联想词推荐给用户。具体地,搜索词的语义分析结果为:搜索词涉政、涉黄、涉恐、涉暴,那么该搜索词为不合法的搜索词;同样地,联想词的语义分析结果为:搜索词涉政、涉黄、涉恐、涉暴,那么该联想词为不合法的联想词。较佳地,在本发明的具体实施例中,电子设备可以根据搜索词与各个联想词之间的关联度,按照关联度由高到低的顺序将搜索词对应的联想词进行排序;然后将排序后的搜索词对应的联想词推荐给用户。较佳地,在本发明的具体实施例中,电子设备可以在搜索词对应的联想词中,获取出关联度高于预设阈值的联想词,并将关联度高于预设阈值的联想词推荐给用户。本发明实施例提出的联想词的推荐方法,先接收用户输入的搜索词;然后根据预先计算的搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取搜索词对应的联想词;再将搜索词对应的联想词推荐给用户。也就是说,在本发明的技术方案中,可以预先计算出搜索词与各个实时资讯素材中的各个中心词之间的关联度,这样就可以在接收到用户输入的搜索词之后,即刻在联想词库中获取到搜索词对应的联想词,从而将搜索词对应的联想词推荐给用户。而在现有的联想词的推荐方法中,基于用户的搜索词召回关联词,这样召回的关联词仅满足用户的搜索需求,不具备可写作的价值;另外,现有的搜索引擎在生成联想词时需要依赖用户搜索,而且通常在新闻发生后一段时间才会产生,时效性比较低,不能满足用户对推荐信息的实时性要求。因此,和现有技术相比,本发明实施例提出的联想词的推荐方法,不仅可以向用户推荐更多且更有写作价值的联想词,而且还可以满足用户对推荐信息的实时性要求;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。实施例三图3为本发明实施例三提供的联想词的推荐方法的流程示意图。如图3所示,联想词的推荐方法可以包括以下步骤:S301、在各个实时资讯素材中抽取出至少两个中心词;其中,各个实时资讯素材按照垂类领域归档或者按照非垂类领域归档。在本发明的具体实施例中,电子设备可以在各个实时资讯素材中抽取出至少两个中心词;其中,各个实时资讯素材按照垂类领域归档或者按照非垂类领域归档。具体地,垂类领域指的是处于同一个分类级别中且相互独立的各个资讯领域,例如,娱乐类资讯领域、体育类资讯领域、新闻类资讯领域、财经类资讯领域;非垂类领域指的是处于不同的分类级别中且相互包含的各个资讯领域。例如,新闻类资讯领域可以进一步划分为国内新闻类资讯领域和国际新闻类资讯领域。在本发明的具体实施例中,实时资讯素材可以为某一个资讯领域中的资讯素材,也可以为多个资讯领域的资讯素材。例如,实时资讯素材可以包括:娱乐类的实时资讯素材、体育类的实时资讯素材、新闻类的实时资讯素材、财经类的实时资讯素材。在本步骤中,电子设备可以分别在娱乐类的实时资讯素材、体育类的实时资讯素材、新闻类的实时资讯素材、财经类的实时资讯素材中抽取出至少两个中心词。S302、将各个实时资讯素材中的每两个中心词组合为一个中心词组;其中,中心词组包括:第一中心词与第二中心词。在本发明的具体实施例中,电子设备可以将各个实时资讯素材中的每两个中心词组合为一个中心词组;其中,中心词组包括:第一中心词与第二中心词。假设电子设备在娱乐类的实时资讯素材中抽取出三个中心词,分别为:中心词A、中心词B和中心词C;然后电子设备可以根据中心词A、中心词B和中心词C组合为三个中心词组,分别为:中心词组1、中心词组2和中心词组3;其中,中心词组1包括:第一中心词中心词A和第二中心词中心词B;中心词组2包括:第一中心词中心词B和第二中心词中心词C;中心词组3包括:第一中心词中心词A和第二中心词中心词C。S303、计算各个中心词组中的第一中心词与第二中心词之间的关联度。在本发明的具体实施例中,电子设备可以计算各个中心词组中的第一中心词与第二中心词之间的关联度。具体地,电子设备可以先根据各个中心词组中的第一中心词与第二中心词,确定被抽取出第一中心词且被抽取出第二中心词的目标资讯素材;然后获取目标资讯素材被点击的次数或者被评论的数量;再根据目标资讯素材被点击的次数或者被评论的数量以及预先确定的第一中心词与第二中心词之间的关系,计算出第一中心词与第二中心词之间的关联度。例如,对于中心词A和中心词B,电子设备可以先确定被抽取出中心词A且被抽取出中心词B的目标资讯素材,假设该目标资讯素材被点击的次数为1000,中心词A与中心词B之间的关系为谓词逻辑的关系,电子设备可以计算出中心词A与中心词B之间的关联度为80%;假设目标资讯素材被点击的次数为10,中心词A与中心词B之间的关系为非谓词逻辑的关系,电子设备可以计算出中心词A与中心词B之间的关联度为40%。具体地,在谓词逻辑中,原子命题可以分解成个体词和谓词。个体词是可以独立存在的事或物,包括现实物、精神物和精神事三种;谓词则是用来刻划个体词的性质的词,即刻画事和物之间的某种关系表现的词。如“苹果”是一个现实物个体词,"苹果可以吃"是一个原子命题,“可以吃”是谓词,刻画“苹果”的一个性质,即与动物或人的一个关系。这里,第一中心词与第二中心词之间的关联度是一个相对值,关联度的大小可以表示出第一中心词与第二中心词之间的关联程度;关联度越高,表示第一中心词与第二中心词之间的关系越紧密;关联度越低,表示第一中心词与第二中心词之间的关系越疏远。S304、接收用户输入的搜索词。在本发明的具体实施例中,电子设备可以接收用户输入的搜索词。具体地,电子设备可以接收用户通过搜素引擎输入的搜素词。S305、若在各个中心词组中查找到与搜索词相同的第一中心词,在各个中心词组中获取出第二中心词作为搜索词对应的联想词;若在各个中心词组中查找到与搜索词相同的第二中心词,在各个中心词组中获取出第一中心词作为搜索词对应的联想词。在本发明的具体实施例中,若电子设备在各个中心词组中查找到与搜索词相同的第一中心词,电子设备可以在各个中心词组中获取出第二中心词作为搜索词对应的联想词;若电子设备在各个中心词组中查找到与搜索词相同的第二中心词,电子设备可以在各个中心词组中获取出第一中心词作为搜索词对应的联想词。例如,假设某个中心词组包括:中心词A和中心词B;电子设备接收用户输入的搜索词为中心词A,在本步骤中,电子设备可以在该中心词组中获取出中心词B作为搜索词对应的联想词。假设某个中心词组包括:中心词A和中心词C;电子设备接收用户输入的搜索词为中心词C,在本步骤中,电子设备可以在该中心词组中获取出中心词A作为搜索词对应的联想词。S306、根据搜索词与各个联想词之间的关联度,按照关联度由高到低的顺序将搜索词对应的联想词进行排序。在本发明的具体实施例中,电子设备可以根据搜索词与各个联想词之间的关联度,按照关联度由高到低的顺序将搜索词对应的联想词进行排序。例如,假设中心词A对应的联想词包括:中心词B、中心词C和中心词D;假设中心词A与中心词B之间的关联度为80%;中心词A与中心词C之间的关联度为40%;中心词A与中心词D之间的关联度为60%。在本步骤中,电子设备可以按照中心词A与中心词B、中心词C和中心词D之间的关联度,按照关联度由高到低的顺序将中心词A对应的联想词进行排序,排序结果为:中心词B、中心词D、中心词C。S307、将排序后的搜索词对应的联想词推荐给用户。在本发明的具体实施例中,电子设备可以将搜索词对应的联想词推荐给用户。较佳地,电子设备在将搜索词对应的联想词推荐给用户之前,还可以先对搜索词以及搜索词对应的联想词进行语义分析;然后根据搜索词的语义分析结果以及搜索词对应的联想词的语义分析结果,对搜索词以及搜索词对应的联想词进行过滤。具体地,若搜索词的语义分析结果为合法的搜索词,并且,联想词的语义分析结果为合法的联想词,电子设备可以将搜索词对应的联想词推荐给用户。若搜索词的语义分析结果为不合法的搜索词,或者,联想词的语义分析结果为不合法的联想词,电子设备不会将搜索词对应的联想词推荐给用户。具体地,搜索词的语义分析结果为:搜索词涉政、涉黄、涉恐、涉暴,那么该搜索词为不合法的搜索词;同样地,联想词的语义分析结果为:搜索词涉政、涉黄、涉恐、涉暴,那么该联想词为不合法的联想词。较佳地,在本发明的具体实施例中,电子设备可以根据搜索词与各个联想词之间的关联度,按照关联度由高到低的顺序将搜索词对应的联想词进行排序;然后将排序后的搜索词对应的联想词推荐给用户。较佳地,在本发明的具体实施例中,电子设备可以在搜索词对应的联想词中,获取出关联度高于预设阈值的联想词,并将关联度高于预设阈值的联想词推荐给用户。本发明实施例提出的联想词的推荐方法,先接收用户输入的搜索词;然后根据预先计算的搜索词与各个实时资讯素材中的中心词之间的关联度,在联想词库中获取搜索词对应的联想词;再将搜索词对应的联想词推荐给用户。也就是说,在本发明的技术方案中,可以预先计算出搜索词与各个实时资讯素材中的中心词之间的关联度,这样就可以在接收到用户输入的搜索词之后,即刻在联想词库中获取到搜索词对应的联想词,从而将搜索词对应的联想词推荐给用户。而在现有的联想词的推荐方法中,基于用户的搜索词召回关联词,这样召回的关联词仅满足用户的搜索需求,不具备可写作的价值;另外,现有的搜索引擎在生成联想词时需要依赖用户搜索,而且通常在新闻发生后一段时间才会产生,时效性比较低,不能满足用户对推荐信息的实时性要求。因此,和现有技术相比,本发明实施例提出的联想词的推荐方法,不仅可以向用户推荐更多且更有写作价值的联想词,而且还可以满足用户对推荐信息的实时性要求;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。实施例四图4为本发明实施例四提供的联想词的推荐装置的第一结构示意图。如图4所示,本发明实施例所述的联想词的推荐装置可以包括:接收模块401、获取模块402和推荐模块403;其中,所述接收模块401,用于接收用户输入的搜索词;所述获取模块402,用于根据预先计算的所述搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取所述搜索词对应的联想词;所述推荐模块403,用于将所述搜索词对应的联想词推荐给所述用户。图5为本发明实施例四提供的联想词的推荐装置的第二结构示意图。如图5所示,所述装置还包括:抽取模块404和计算模块405;其中,所述抽取模块404,用于在各个实时资讯素材中抽取出至少两个中心词;其中,各个实时资讯素材按照垂类领域归档或者按照非垂类领域归档;将各个实时资讯素材中的每两个中心词组合为一个中心词组;其中,所述中心词组包括:第一中心词与第二中心词;所述计算模块405,用于计算各个中心词组中的所述第一中心词与所述第二中心词之间的关联度。进一步的,所述计算模块405,具体用于根据各个中心词组中的第一中心词与第二中心词,确定被抽取出所述第一中心词且被抽取出所述第二中心词的目标资讯素材;获取所述目标资讯素材被点击的次数或者被评论的数量;根据所述目标资讯素材被点击的次数或者被评论的数量以及预先确定的所述第一中心词与所述第二中心词之间的关系,计算出所述第一中心词与所述第二中心词之间的关联度。进一步的,所述获取模块402,具体用于若在各个中心词组中查找到与所述搜索词相同的第一中心词,在各个中心词组中获取出所述第二中心词作为所述搜索词对应的联想词;若在各个中心词组中查找到与所述搜索词相同的第二中心词,在各个中心词组中获取出所述第一中心词作为所述搜索词对应的联想词。进一步的,所述推荐模块403,还用于对所述搜索词以及所述搜索词对应的联想词进行语义分析;根据所述搜索词的语义分析结果以及所述搜索词对应的联想词的语义分析结果,对所述搜索词以及所述搜索词对应的联想词进行过滤。进一步的,所述推荐模块403包括:排序子模块4031和推荐子模块4032;其中,所述排序子模块4031,用于根据所述搜索词与各个联想词之间的关联度,按照关联度由高到低的顺序将所述搜索词对应的联想词进行排序;所述推荐子模块4032,用于将排序后的所述搜索词对应的联想词推荐给所述用户。上述联想词的推荐装置可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的联想词的推荐方法。实施例五图6为本发明实施例五提供的电子设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性电子设备的框图。图6显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图6所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件包括系统存储器28和处理单元16的总线18。总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构ISA总线,微通道体系结构MAC总线,增强型ISA总线、视频电子标准协会VESA局域总线以及外围组件互连PCI总线。电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器RAM30和或高速缓存存储器32。电子设备12可以进一步包括其它可移动不可移动的、易失性非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质图6未显示,通常称为“硬盘驱动器”。尽管图6中未示出,可以提供用于对可移动非易失性磁盘例如“软盘”读写的磁盘驱动器,以及对可移动非易失性光盘例如CD-ROM,DVD-ROM或者其它光介质读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组例如至少一个程序模块,这些程序模块被配置以执行本发明各实施例的功能。具有一组至少一个程序模块42的程序实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和或方法。电子设备12也可以与一个或多个外部设备14例如键盘、指向设备、显示器24等通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备例如网卡,调制解调器等等通信。这种通信可以通过输入输出IO接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络例如局域网LAN,广域网WAN和或公共网络,例如因特网通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图6中未示出,可以结合电子设备12使用其它硬件和或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的联想词的推荐方法。实施例六本发明实施例六提供了一种计算机存储介质。本发明实施例的计算机可读存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子非穷举的列表包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器RAM、只读存储器ROM、可擦式可编程只读存储器EPROM或闪存、光纤、便携式紧凑磁盘只读存储器CD-ROM、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网LAN或广域网WAN—连接到用户计算机,或者,可以连接到外部计算机例如利用因特网服务提供商来通过因特网连接。注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

权利要求:1.一种联想词的推荐方法,其特征在于,所述方法包括:接收用户输入的搜索词;根据预先计算的所述搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取所述搜索词对应的联想词;将所述搜索词对应的联想词推荐给所述用户。2.根据权利要求1所述的方法,其特征在于,在所述接收用户输入的搜索词之前,所述方法还包括:在各个实时资讯素材中抽取出至少两个中心词;其中,各个实时资讯素材按照垂类领域归档或者按照非垂类领域归档;将各个实时资讯素材中的每两个中心词组合为一个中心词组;其中,所述中心词组包括:第一中心词与第二中心词;计算各个中心词组中的所述第一中心词与所述第二中心词之间的关联度。3.根据权利要求2所述的方法,其特征在于,所述计算各个中心词组中的第一中心词与第二中心词之间的关联度,包括:根据各个中心词组中的第一中心词与第二中心词,确定被抽取出所述第一中心词且被抽取出所述第二中心词的目标资讯素材;获取所述目标资讯素材被点击的次数或者被评论的数量;根据所述目标资讯素材被点击的次数或者被评论的数量以及预先确定的所述第一中心词与所述第二中心词之间的关系,计算出所述第一中心词与所述第二中心词之间的关联度。4.根据权利要求3所述的方法,其特征在于,所述根据预先计算的所述搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取所述搜索词对应的联想词,包括:若在各个中心词组中查找到与所述搜索词相同的第一中心词,在各个中心词组中获取出所述第二中心词作为所述搜索词对应的联想词;若在各个中心词组中查找到与所述搜索词相同的第二中心词,在各个中心词组中获取出所述第一中心词作为所述搜索词对应的联想词。5.根据权利要求1所述的方法,其特征在于,在所述将所述搜索词对应的联想词推荐给所述用户之前,所述方法还包括:对所述搜索词以及所述搜索词对应的联想词进行语义分析;根据所述搜索词的语义分析结果以及所述搜索词对应的联想词的语义分析结果,对所述搜索词以及所述搜索词对应的联想词进行过滤。6.根据权利要求1所述的方法,其特征在于,所述将所述搜索词对应的联想词推荐给所述用户,包括:根据所述搜索词与各个联想词之间的关联度,按照关联度由高到低的顺序将所述搜索词对应的联想词进行排序;将排序后的所述搜索词对应的联想词推荐给所述用户。7.一种联想词的推荐装置,其特征在于,所述装置包括:接收模块、获取模块和推荐模块;其中,所述接收模块,用于接收用户输入的搜索词;所述获取模块,用于根据预先计算的所述搜索词与各个实时资讯素材中的各个中心词之间的关联度,在联想词库中获取所述搜索词对应的联想词;所述推荐模块,用于将所述搜索词对应的联想词推荐给所述用户。8.根据权利要求7所述的装置,其特征在于,所述装置还包括:抽取模块和计算模块;其中,所述抽取模块,用于在各个实时资讯素材中抽取出至少两个中心词;其中,各个实时资讯素材按照垂类领域归档或者按照非垂类领域归档;将各个实时资讯素材中的每两个中心词组合为一个中心词组;其中,所述中心词组包括:第一中心词与第二中心词;所述计算模块,用于计算各个中心词组中的所述第一中心词与所述第二中心词之间的关联度。9.根据权利要求8所述的装置,其特征在于:所述计算模块,具体用于根据各个中心词组中的第一中心词与第二中心词,确定被抽取出所述第一中心词且被抽取出所述第二中心词的目标资讯素材;获取所述目标资讯素材被点击的次数或者被评论的数量;根据所述目标资讯素材被点击的次数或者被评论的数量以及预先确定的所述第一中心词与所述第二中心词之间的关系,计算出所述第一中心词与所述第二中心词之间的关联度。10.根据权利要求9所述的装置,其特征在于:所述获取模块,具体用于若在各个中心词组中查找到与所述搜索词相同的第一中心词,在各个中心词组中获取出所述第二中心词作为所述搜索词对应的联想词;若在各个中心词组中查找到与所述搜索词相同的第二中心词,在各个中心词组中获取出所述第一中心词作为所述搜索词对应的联想词。11.根据权利要求7所述的装置,其特征在于:所述推荐模块,还用于对所述搜索词以及所述搜索词对应的联想词进行语义分析;根据所述搜索词的语义分析结果以及所述搜索词对应的联想词的语义分析结果,对所述搜索词以及所述搜索词对应的联想词进行过滤。12.根据权利要求7所述的装置,其特征在于,所述推荐模块包括:排序子模块和推荐子模块;其中,所述排序子模块,用于根据所述搜索词与各个联想词之间的关联度,按照关联度由高到低的顺序将所述搜索词对应的联想词进行排序;所述推荐子模块,用于将排序后的所述搜索词对应的联想词推荐给所述用户。13.一种电子设备,其特征在于,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6中任一项所述的联想词的推荐方法。14.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一项所述的联想词的推荐方法。

百度查询: 北京百度网讯科技有限公司 一种联想词的推荐方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。