买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于依存句法分析和汉语语法的多轮语义分析方法_四川长虹电器股份有限公司_202010934684.8 

申请/专利权人:四川长虹电器股份有限公司

申请日:2020-09-08

公开(公告)日:2020-11-24

公开(公告)号:CN111984778A

主分类号:G06F16/332(20190101)

分类号:G06F16/332(20190101);G06F40/30(20200101);G06F40/211(20200101);G06F40/295(20200101);G06F16/36(20190101);G06F16/33(20190101)

优先权:

专利状态码:有效-授权

法律状态:2022.06.03#授权;2020.12.11#实质审查的生效;2020.11.24#公开

摘要:本发明公开了一种基于依存句法分析和汉语语法的多轮语义分析方法,其特征在于,包括:定义知识图谱实体数据,构成实体库;对文本进行分词得到的词语在不同领域、不同意图下出现的总次数,构成准实时词库;在不同领域、不同意图下分别采用依存句法分析将准实时词库的词语形成一个个短语,并将短语出现的次数按照记忆曲线的规律变化,形成短语的频次;统计同一短语在不同领域下的频次,得到短语在不同领域下的关联程度,得到短语意图搜索库;对用户输入进行多轮语义解析,得到用户意图。本发明利用句法树和汉语言语法重组和重排多轮语句,进而判断领域意图,能够识别多轮任务型对话意图。

主权项:1.一种基于依存句法分析和汉语语法的多轮语义分析方法,其特征在于,包括:步骤S100:定义知识图谱实体数据,构成实体库;步骤S200:获取每日用户日志数据,每日用户日志数据包含领域、意图、文本和出现的时刻,对文本进行分词并分别统计分词后得到的词语在不同领域、不同意图下出现的总次数,该总次数按照记忆曲线的规律变化,衰减后的总次数加上再次出现的次数作为当前该词语的词频,构成准实时词库;步骤S300:在不同领域、不同意图下分别采用依存句法分析将准实时词库的词语形成一个个短语,并将短语出现的次数按照记忆曲线的规律变化,形成短语的频次;统计同一短语在不同领域下的频次,得到短语在不同领域下的关联程度,得到短语意图搜索库;步骤S400:对用户输入进行多轮语义解析,得到用户意图,具体为:步骤S410:将用户本轮输入和用户上N轮输入均利用依存句法分析方法获得词性和句法关系,将句法关系封装成句法树;步骤S420:遍历句法树中每个节点,在实体库中查找对应的实体数据;步骤S430:语句标准化处理;步骤S440:语句整理,并重新拼接新的句法树:步骤S450:意图判断,根据语句整理后的拼接的新的句法树,如果主谓宾关系存在,那么匹配成功并且返回当前领域意图及其每个节点的实体参数;如果不存在,判定核心词及其每个节点的关系在该领域意图下是否存在,如果存在,匹配成功,如果有任一节点不存在,匹配下一个领域意图。

全文数据:

权利要求:

百度查询: 四川长虹电器股份有限公司 基于依存句法分析和汉语语法的多轮语义分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。