买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】样本数据构建方法及装置_杭州阿里云飞天信息技术有限公司_202410109946.5 

申请/专利权人:杭州阿里云飞天信息技术有限公司

申请日:2024-01-25

公开(公告)日:2024-04-30

公开(公告)号:CN117633540B

主分类号:G06F18/214

分类号:G06F18/214;G06F16/332;G06F16/36;G06N5/022

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2024.03.19#实质审查的生效;2024.03.01#公开

摘要:本说明书实施例提供样本数据构建方法及装置,其中所述方法包括:确定目标数据以及目标数据中的事项标签数据和事项知识数据;根据事项标签数据和事项知识数据生成知识链路,并基于知识链路确定目标数据的图结构信息;确定事项标签数据中的事项标签子数据,并在知识链路中选择事项标签子数据对应的链路节点,根据链路节点生成图结构信息对应的链路节点组信息;利用图结构信息和链路节点组信息构建目标数据对应的样本对话数据,其中,样本对话数据用于训练对话模型。通过图结构信息和链路节点组信息构建出样本对话数据,利于后续利用样本对话数据训练出更准确的对话模型,为用户提供更好的对话问答服务。

主权项:1.一种样本数据构建方法,包括:确定目标数据以及所述目标数据中的事项标签数据和事项知识数据,其中,所述事项标签数据为所述目标数据包括的事项关键词文本,所述事项知识数据为所述目标数据包括的事项知识文本;根据所述事项标签数据和所述事项知识数据生成知识链路,并基于所述知识链路确定所述目标数据的图结构信息,其中,根据所述事项标签数据和所述事项知识数据生成知识链路包括:在所述事项标签数据中确定每个目标事项标签对应的标签层级信息,按照所述标签层级信息对所述每个目标事项标签进行排序,根据排序结果确定事项标签队列,在所述事项知识数据中选择所述事项标签队列对应的目标知识数据,并根据所述事项标签队列和所述目标知识数据生成知识链路;确定所述事项标签数据中的事项标签子数据,并在所述知识链路中选择所述事项标签子数据对应的链路节点,根据所述链路节点生成所述图结构信息对应的链路节点组信息;利用所述图结构信息和所述链路节点组信息构建所述目标数据对应的样本对话数据,其中,所述样本对话数据用于训练对话模型,所述样本对话数据由用户模拟组件基于所述链路节点组信息,和助手模拟组件基于所述图结构信息构建获得。

全文数据:

权利要求:

百度查询: 杭州阿里云飞天信息技术有限公司 样本数据构建方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术