申请/专利权人:北京百度网讯科技有限公司
申请日:2016-03-15
公开(公告)日:2020-07-24
公开(公告)号:CN105843850B
主分类号:G06F16/33(20190101)
分类号:G06F16/33(20190101);G06F16/31(20190101)
优先权:
专利状态码:有效-授权
法律状态:2020.07.24#授权;2016.09.07#实质审查的生效;2016.08.10#公开
摘要:本发明公开了一种搜索优化方法和装置,其中,搜索优化方法包括:获取输入的关键词,并将关键词切分为多个字段;获取每个字段对于关键词的重要度,并根据重要度获取符合预设条件的候选字段;基于倒排库对候选字段进行倒排拉链检索,并获取对应的候选关键词;基于迭代决策树GBDT模型对候选关键词进行排序,并获取排序结果;以及根据排序结果优化关键词,并根据优化后的关键词进行搜索,以获取搜索结果。本发明实施例通过对输入的关键词进行分析,并基于倒排库获取对应的候选关键词,再对候选关键词进行排序,以及根据排序结果优化关键词,最后根据优化后的关键词进行搜索获取搜索结果,从而获得更加满足用户需求的搜索结果,提升用户搜索体验。
主权项:1.一种搜索优化方法,其特征在于,包括以下步骤:获取输入的关键词,并将所述关键词切分为多个字段;获取每个字段对于所述关键词的重要度,并根据所述重要度获取符合预设条件的候选字段;基于倒排库对所述候选字段进行倒排拉链检索,并获取对应的候选关键词,其中,所述倒排拉链检索中的关键词样本的检索次数和满意度满足预设要求;基于迭代决策树GBDT模型对所述候选关键词进行排序,并获取排序结果;以及根据所述排序结果优化所述关键词,并根据优化后的关键词进行搜索,以获取搜索结果;其中,基于迭代决策树GBDT模型对所述候选关键词进行排序,并获取排序结果,还包括:提取所述关键词的主干信息;获取所述关键词与所述候选关键词的第一GBDT得分;获取所述主干信息与所述候选关键词的第二GBDT得分;获取所述第一GBDT得分和所述第二GBDT得分的平均得分,并根据所述平均得分对所述候选关键词进行排序,以获取排序结果。
全文数据:
权利要求:
百度查询: 北京百度网讯科技有限公司 搜索优化方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。