申请/专利权人:腾讯科技(深圳)有限公司
申请日:2020-07-22
公开(公告)日:2020-11-24
公开(公告)号:CN111738000B
主分类号:G06F40/289(20200101)
分类号:G06F40/289(20200101);G06N3/04(20060101);G06N3/08(20060101)
优先权:
专利状态码:有效-授权
法律状态:2020.11.24#授权;2020.10.30#实质审查的生效;2020.10.02#公开
摘要:本申请公开了一种短语推荐的方法以及相关装置,涉及人工智能的自然语言处理技术。通过自动构建批数据,并从批数据中确定与目标短语之间的距离大于预设阈值的负样本,以构建训练三元组对目标神经网络进行训练;并根据训练后的目标神经网络对短语向量集进行更新;进而基于输入短语与更新后的短语向量集中的短语的距离关系确定推荐短语。从而实现了智能短语推荐的过程,由于训练三元组中样本之间距离关系的调整,保证了对于目标神经网络训练的准确性,使得输入短语的向量表示更准确,提高了推荐短语的准确性。
主权项:1.一种短语推荐的方法,其特征在于,包括:将短语样本集输入目标神经网络,以得到短语向量集;从所述短语向量集中提取批数据,所述批数据中包括多个训练短语向量,所述训练短语向量之间对应的语义相关联;从所述批数据中确定与目标短语之间的距离大于预设阈值的样本,以作为负样本短语,所述目标短语为多个所述训练短语向量中的一个;基于所述负样本短语、所述目标短语和正样本短语构建训练三元组,以对所述目标神经网络进行训练,所述正样本短语为至少两个所述训练短语向量中的一个,所述正样本短语与所述目标短语不同,所述正样本短语与所述目标短语之间的距离小于所述负样本短语与所述目标短语之间的距离;根据训练后的所述目标神经网络对所述短语向量集进行更新;将输入短语输入训练后的所述目标神经网络,以得到输入向量;基于所述输入向量与更新后的所述短语向量集中的向量的距离关系确定推荐短语。
全文数据:
权利要求:
百度查询: 腾讯科技(深圳)有限公司 一种短语推荐的方法以及相关装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。