买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于语义理解的实体识别方法、装置、计算机设备和介质_中国平安人寿保险股份有限公司_202011148668.2 

申请/专利权人:中国平安人寿保险股份有限公司

申请日:2020-10-23

公开(公告)日:2024-04-16

公开(公告)号:CN112215008B

主分类号:G06F40/295

分类号:G06F40/295;G06F40/30;G06F40/242;G06F40/284;G06F40/216

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2021.12.28#实质审查的生效;2021.01.12#公开

摘要:本申请实施例属于语义识别领域,应用于智慧城市领域中,涉及一种基于语义理解的实体识别方法,包括对于用户的输入文本,提取所述输入文本的主干词语;将所述主干词语与至少一个相邻词语组成文本片段,其中,所述相邻词语是与所述主干词语相邻的词语;计算所述文本片段与实体词典中实体词的语义相似度;根据所述语义相似度对所述实体词进行过滤,得到候选实体;通过训练好的语言模型对包括所述候选实体的文本片段进行消歧处理,得到实体识别结果。本申请还提供一种基于语义理解的实体识别装置、计算机设备及存储介质。采用本方法解决了现有技术中用传统词典匹配能力一般,无法识别词典外的实体,缺乏泛化能力的技术问题。

主权项:1.一种基于语义理解的实体识别方法,其特征在于,所述方法包括:对于用户的输入文本,提取所述输入文本的主干词语;将所述主干词语与至少一个相邻词语组成文本片段,其中,所述相邻词语是与所述主干词语相邻的词语;计算所述文本片段与实体词典中实体词的语义相似度;根据所述语义相似度对所述实体词进行过滤,得到候选实体;通过训练好的语言模型对包括所述候选实体的文本片段进行消歧处理,得到实体识别结果;其中,所述计算所述文本片段与实体词典中实体词的语义相似度,包括:从所述实体词典中搜索是否存在与所述文本片段中词语对应的实体序列,其中,所述实体序列中包括至少一个实体词;若存在,则计算所述文本片段与所述实体序列的语义相似度;所述根据所述语义相似度对所述实体词进行过滤,得到候选实体,包括:将所述语义相似度不小于预设值的实体词作为候选实体;所述计算所述文本片段与所述实体序列的语义相似度,包括:通过公式:;计算所述文本片段与所述实体序列的语义相似度,其中,表示文本片段与实体词的相似度、为文本片段包括的词语数量、分别表示文本片段、实体词中的词语、为文本片段中词语对应的词向量、为实体词中词语对应的词向量、a为文本片段、b为实体词。

全文数据:

权利要求:

百度查询: 中国平安人寿保险股份有限公司 基于语义理解的实体识别方法、装置、计算机设备和介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。