买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】搜索词条处理方法、装置、计算机设备和计算机存储介质_腾讯科技(深圳)有限公司_202311205901.X 

申请/专利权人:腾讯科技(深圳)有限公司

申请日:2023-09-19

公开(公告)日:2024-01-26

公开(公告)号:CN116932922B

主分类号:G06F16/9535

分类号:G06F16/9535;G06F16/335;G06F40/30;G06F40/242;G06F40/232;G06F40/216;G06F18/22;G06F18/241

优先权:

专利状态码:有效-授权

法律状态:2024.01.26#授权;2023.11.10#实质审查的生效;2023.10.24#公开

摘要:本申请涉及一种搜索词条处理方法、装置、计算机设备和计算机存储介质。该方法涉及人工智能技术,该方法包括:基于在同一搜索会话中先后输入的两个搜索词条,得到候选纠错对;基于将两个搜索词条拼接后进行语义特征提取得到的纠错对语义特征,预测两个搜索词条的文本相似度;获取候选纠错对的文本相似统计特征与搜索行为统计特征;根据文本相似度、文本相似统计特征与搜索行为统计特征,识别候选纠错对是否为有效纠错对;若候选纠错对为有效纠错对,则将有效纠错对加入纠错对库中,有效纠错对用于对在线搜索词条进行纠错。采用本方法能够大幅提高纠错效果和用户的搜索体验。

主权项:1.一种搜索词条处理方法,其特征在于,所述方法包括:基于在同一搜索会话中先后输入的两个搜索词条,得到候选纠错对,所述先后输入的两个搜索词条分别为第一搜索词条与第二搜索词条;将所述两个搜索词条拼接后输入至语言表示模型进行语义特征提取,得到纠错对语义特征,基于所述纠错对语义特征预测所述两个搜索词条的文本相似度;获取所述候选纠错对的文本相似统计特征;对所述候选纠错对所包括的第一搜索词条与第二搜索词条进行序列对齐处理,得到所述第一搜索词条与所述第二搜索词条的序列对齐结果,根据所述序列对齐结果从所述第一搜索词条与所述第二搜索词条中确定第一文本片段与由所述第一文本片段切换至的第二文本片段,统计在多个历史搜索会话中由所述第一文本片段切换到每个其它文本片段的切换次数,以及统计切换到每个其它文本片段的切换次数之和,统计由所述第一文本片段切换到所述第二文本片段的切换次数与切换到每个其它文本片段的切换次数之和的比值,将由所述第一文本片段切换到每个其它文本片段的切换次数与所述比值拼接,获得所述候选纠错对的切换行为特征;根据所述文本相似度、所述文本相似统计特征与所述切换行为特征,识别所述候选纠错对是否为有效纠错对;若所述候选纠错对为有效纠错对,则将所述有效纠错对加入纠错对库中,所述有效纠错对用于对在线搜索词条进行纠错。

全文数据:

权利要求:

百度查询: 腾讯科技(深圳)有限公司 搜索词条处理方法、装置、计算机设备和计算机存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。