申请/专利权人:湖南三湘银行股份有限公司
申请日:2023-12-27
公开(公告)日:2024-04-02
公开(公告)号:CN117474043B
主分类号:G06N3/0455
分类号:G06N3/0455;G06F40/216;G06N3/08;G06F16/332;G06F16/33
优先权:
专利状态码:有效-授权
法律状态:2024.04.02#授权;2024.02.20#实质审查的生效;2024.01.30#公开
摘要:本发明涉及智能问答技术领域,尤其涉及一种基于训练模型的智能问答系统,包括,数据收集单元,其用于收集某一用户的若干问题文本和对应的回答结果;预训练模型构建单元,根据确定连续性发问的若干问题文本和对应的回答结果进行预训练,生成预训练模型,包括,预处理单元,其用以对若干问题文本进行预处理,生成预处理数据包;判断单元,其用以对预处理数据包内的数据进行连续性判断和关联处理;构建单元,其根据连续性发问的问题文本和对应的回答结果生成预训练模型;预训练模型优化单元,其用以对构建的预训练模型进行优化调整。本发明通过针对用户连续性的发问进行关联判断,以提高问答系统中的预训练模型针对连续性的问题的结果的处理程度。
主权项:1.一种基于训练模型的智能问答系统,其特征在于,包括,数据收集单元,其用于收集某一用户的若干问题文本和对应的回答结果;预训练模型构建单元,其与所述数据收集单元相连,根据确定连续性发问的若干问题文本和对应的回答结果进行预训练,生成预训练模型;预训练模型优化单元,其与所述预训练模型构建单元相连,用以对构建的预训练模型进行优化调整,包括,对任一连续性问题的回答结果根据用户的选择习惯进行选择比例计算并输出选择比例最大的回答结果、对于任一连续性发问的问题文本进行预训练模型符合度分析并确定是否继续进行此问题文本的训练、对预训练模型在进行构建过程中的数据存储情况进行存储时长调整和关联存储时长分级判断和处理;所述预训练模型构建单元,包括,预处理单元,其与所述数据收集单元相连,用以对若干问题文本进行预处理,生成预处理数据包,所述预处理包括,关联此用户的输入习惯、对问题文本进行语序分析和逻辑分析、对分析后的问题文本进行停用词变更及文本清洗;判断单元,其与所述预处理单元相连,用以对预处理数据包内的数据进行连续性判断和关联处理,确定属于连续性发问的任一问题文本,并与其关联的问题文本连接生成关联树生成,并确定此关联树下的任一问题文本的关联等级,进行回答结果关联,汇总分析任一回答结果重复次数的比例值,进行列举;构建单元,其与所述预处理单元和所述判断单元相连,所述构建单元内存有Transformer架构,所述构建单元根据连续性发问的问题文本和对应的回答结果进行预训练,生成预训练模型。
全文数据:
权利要求:
百度查询: 湖南三湘银行股份有限公司 一种基于训练模型的智能问答系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。