恭喜浙江大学高端装备研究院谢海波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江大学高端装备研究院申请的专利大模型问答知识库的生成方法及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119719389B 。
龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510231692.9,技术领域涉及:G06F16/36;该发明授权大模型问答知识库的生成方法及电子设备是由谢海波;白洁;朱茗西;王嘉杰;王柏村设计研发完成,并于2025-02-28向国家知识产权局提交的专利申请。
本大模型问答知识库的生成方法及电子设备在说明书摘要公布了:本申请涉及一种大模型问答知识库的生成方法及电子设备。其中,该方法包括:对获取的多源语料数据进行预处理,得到预处理后的多源语料数据;基于预处理后的多源语料数据的数据结构对预处理后的多源语料数据进行知识抽取,得到多源语料知识;将多源语料知识转换成问答对;对问答对进行去重与冲突消解,生成大模型问答知识库。本申请解决了现阶段生成用于大模型训练的问答知识库的技术对多源语料知识的解析与处理能力较差的技术问题。
本发明授权大模型问答知识库的生成方法及电子设备在权利要求书中公布了:1.一种大模型问答知识库的生成方法,其特征在于,包括:对获取的多源语料数据进行预处理,得到预处理后的多源语料数据;基于所述预处理后的多源语料数据的数据结构对所述预处理后的多源语料数据进行知识抽取,得到多源语料知识;在所述预处理后的多源语料数据为层级表格数据的情况下,基于所述预处理后的多源语料数据的数据结构对所述预处理后的多源语料数据进行知识抽取,包括:将所述层级表格数据转换为二维数据表格,其中,所述二维数据表格中的每一行数据包括:索引、编号及数据内容;遍历所述二维数据表格,根据所述每一行数据的编号确定该行数据对应的节点位置以及与其他节点之间的关系;通过所述索引将所述二维数据表格中存在父子关系的数据进行关联,并记录所述每一行数据的父节点与子节点,生成数据节点关系表格;分别将所述数据节点关系表格中的每一行数据转换为JSON格式的数据;根据所述每一行数据的编号确定该行数据对应的节点位置以及与其他节点之间的关系,包括:将所述二维数据表格的名称设置为根节点;分别将所述二维数据表格中的每一行数据包括的编号转换为字符串,若所述字符串中不包含目标符号,将所述字符串对应的一行数据确定为一级父节点,并将所述根节点记录为所述一级父节点的父节点;若所述字符串中包含所述目标符号,将所述字符串对应的一行数据确定为子节点,其中,所述子节点的父节点为所述子节点对应的一行数据的编号去掉最低层级后的编号对应的一行数据;若所述字符串中包含的编号为目标编号,确定所述目标编号对应的一行数据为所述父节点或所述子节点的数据内容;将所述多源语料知识转换成问答对;对所述问答对进行去重与冲突消解,生成大模型问答知识库。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学高端装备研究院,其通讯地址为:311100 浙江省杭州市临平区兴国路503号5幢103室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。