买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】知识库的标问标答的治理方法、装置、设备及存储介质_平安科技(深圳)有限公司_202011479831.3 

申请/专利权人:平安科技(深圳)有限公司

申请日:2020-12-15

公开(公告)日:2023-08-29

公开(公告)号:CN112541054B

主分类号:G06F16/33

分类号:G06F16/33;G06F16/332;G06F16/335;G06F40/279

优先权:

专利状态码:有效-授权

法律状态:2023.08.29#授权;2021.04.09#实质审查的生效;2021.03.23#公开

摘要:本申请涉及人工智能技术领域,揭示了一种知识库的标问标答的治理方法、装置、设备及存储介质,其中方法包括:将多条待治理的标问标答对进行实体识别、实体数据的去重处理和实体数据对齐处理得到实体对齐后的标问标答对集;根据实体对齐后的标问标答对集进行相似性判断得到疑似相似的标问标答对集、不完全相似的标问标答对集和不相似的标问标答对集,将不相似的标问标答对集更新到目标知识库中;对疑似相似的标问标答对集和不完全相似的标问标答对集进行属性去重处理和属性值去重处理得到去重后的标问标答对集,将去重后的标问标答对集更新到目标知识库中。提高了知识库的质量,不需要持续人工参与治理过程,提高了治理效率。

主权项:1.一种知识库的标问标答的治理方法,其特征在于,所述方法包括:获取多条待治理的标问标答对,所述待治理的标问标答对包括:待治理的标问文本数据和待治理的标答文本数据;将所述多条待治理的标问标答对输入实体识别模型进行实体识别,得到所述多条待治理的标问标答对对应的待去重的实体数据集,所述实体识别模型是基于预训练模型bert_this和CRF网络训练得到的模型;对所述待去重的实体数据集进行实体数据的去重处理,得到所述多条待治理的标问标答对对应的去重后的实体数据集;根据所述去重后的实体数据集和所述多条待治理的标问标答对进行实体数据对齐处理,得到实体对齐后的标问标答对集;根据所述实体对齐后的标问标答对集进行相似性判断,得到疑似相似的标问标答对集、不完全相似的标问标答对集和不相似的标问标答对集,将所述不相似的标问标答对集更新到目标知识库中;对所述疑似相似的标问标答对集和所述不完全相似的标问标答对集进行属性去重处理和属性值去重处理,得到去重后的标问标答对集,将所述去重后的标问标答对集更新到所述目标知识库中;所述根据所述实体对齐后的标问标答对集进行相似性判断,得到疑似相似的标问标答对集、不完全相似的标问标答对集和不相似的标问标答对集的步骤,包括:采用文本类别和实体数据对所述实体对齐后的标问标答对集进行划分,得到多个标问文本数据同实体子集和多个标答文本数据同实体子集;采用余弦相似度计算方法分别对每个所述标问文本数据同实体子集中的实体对齐后的标问文本数据进行两两相似度计算,得到所述多个标问文本数据同实体子集各自对应的标问相似度矩阵;采用余弦相似度计算方法分别对每个所述标答文本数据同实体子集中的实体对齐后的标答文本数据进行两两相似度计算,得到所述多个标答文本数据同实体子集各自对应的标答相似度矩阵;根据所述实体对齐后的标问标答对集、所述标问相似度矩阵、所述标答相似度矩阵进行相似性判断,得到所述疑似相似的标问标答对集、所述不完全相似的标问标答对集和所述不相似的标问标答对集。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 知识库的标问标答的治理方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。