申请/专利权人:中国科学技术大学
申请日:2023-12-19
公开(公告)日:2024-04-05
公开(公告)号:CN117828013A
主分类号:G06F16/33
分类号:G06F16/33;G06F16/35;G06F18/241;G06F18/214;G06F16/332;G06N3/0464
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.23#实质审查的生效;2024.04.05#公开
摘要:本发明公开了一种面向对话系统训练数据不足的意图识别方法和装置。其中,该方法包括:通过意图分类模块将用户输入文本识别为问询意图还是寒暄意图;若识别为寒暄意图,则传递给寒暄模块的机器人进行回复;若识别为问询意图,则传递给意图检测模块进行识别;若意图检测模块将用户输入文本识别为某一已知意图类别,则传递给此类别对应的问答机器人进行回复;若识别为未知意图类别,则进行拒识回复;通过意图探索模块对一定时间段内的未知意图类别中数据进行聚类分析,以此让智能客服的管理维护人员对意图类别进行迭代更新。本发明通过构建三层的意图识别架构,能够应对意图训练数据或类别不足等情况,为后续改善用于训练的文本数据质量提供了方向。
主权项:1.一种面向对话系统训练数据不足的意图识别方法,其特征在于,包括:S1、通过意图分类模块对用户输入文本进行识别,若识别为寒暄意图,则传递给寒暄模块的机器人进行回复;若识别为问询意图,则传递给意图检测模块进行识别;S2、若意图检测模块将用户输入文本识别为某一已知意图类别,则传递给此类别对应的问答机器人进行回复;若识别为未知意图类别,则进行拒识回复并传递给意图探索模块进行识别;S3、通过意图探索模块对一定时间段内的未知意图类别对应的输入文本进行聚类识别,并对识别后的数据和类别进行筛选,若筛选为新的意图类别,则增加该新的意图类别以及对应的文本数据至已知意图类别的数据集中;否则,将筛选后的文本数据添加至已知意图类别的数据集中。
全文数据:
权利要求:
百度查询: 中国科学技术大学 一种面向对话系统训练数据不足的意图识别方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。