申请/专利权人:平安科技(深圳)有限公司
申请日:2020-12-16
公开(公告)日:2024-03-19
公开(公告)号:CN112528040B
主分类号:G06F16/36
分类号:G06F16/36;G06F40/295
优先权:
专利状态码:有效-授权
法律状态:2024.03.19#授权;2021.04.06#实质审查的生效;2021.03.19#公开
摘要:本申请实施例属于大数据领域,应用于智慧政务教育领域中,涉及一种基于知识图谱的引导教唆语料的检测方法及其相关设备,包括接收标准语料数据集,对标准语料数据集进行特征提取,获得标准语料特征,标准语料数据集中不存在引导教唆信息;基于标准语料特征构建第一知识图谱;接收待检测语料,对待检测语料进行命名实体识别,获得待检测实体,在第一知识图谱中分别对每个待检测实体进行推演;当待检测实体推演失败时,将推演失败的待检测实体作为引导教唆实体,并将引导教唆实体对应的待检测语料作为引导教唆语料,输出引导教唆语料。其中,第一知识图谱可存储于区块链中。本申请能够快速识别出引导教唆语料,从而实现对引导教唆行为的检测。
主权项:1.一种基于知识图谱的引导教唆语料的检测方法,其特征在于,包括下述步骤:接收标准语料数据集,对所述标准语料数据集进行特征提取,获得标准语料特征,其中,所述标准语料数据集中不存在引导教唆信息;基于所述标准语料特征构建第一知识图谱;接收待检测语料,对所述待检测语料进行命名实体识别,获得待检测实体,并在所述第一知识图谱中分别对每个所述待检测实体进行推演,获得推演结果;当所述推演结果为推演失败时,将推演失败的待检测实体作为引导教唆实体,并将所述引导教唆实体对应的所述待检测语料作为引导教唆语料,输出所述引导教唆语料;当所述推演结果为推演成功时,基于推演成功的待检测实体更新所述第一知识图谱,获得第二知识图谱;其中,所述在所述第一知识图谱中分别对每个所述待检测实体进行推演,获得推演结果的步骤包括:通过在第一知识图谱中进行查找确定,若无所述待检测实体,触发相似度算法,通过计算第一知识图谱中的各目标实体与待检测实体之间的语义相似度,确定出语义相似度超过预设的阈值的目标实体,作为替代实体,若找到在第一知识图谱中替代实体的路径,从而确定推演结果为推演成功,而若第一知识图谱中不存在与待检测实体之间的语义相似度超过预设的阈值的目标实体,则输出的推演结果为推演失败;其中,当所述推演结果为推演失败时,将推演失败的待检测实体作为引导教唆实体,并将所述引导教唆实体对应的待检测语料作为引导教唆语料,输出所述引导教唆语料的步骤包括:当所述推演结果为推演失败时,将推演失败的待检测实体作为引导教唆实体,并基于所述引导教唆实体对应的待检测语料生成待检测知识图谱;确定所述待检测知识图谱和所述第一知识图谱之间是否存在矛盾关系;当所述待检测知识图谱和所述第一知识图谱之间存在矛盾关系时,将所述引导教唆实体对应的待检测语料作为引导教唆语料。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 基于知识图谱的引导教唆语料的检测方法及其相关设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。