【发明公布】一种模型训练方法和解决特定领域问题的方法_清华大学_202410166430.4

导航：龙图腾网> 最新专利技术> 一种模型训练方法和解决特定领域问题的方法_清华大学_202410166430.4

申请/专利权人：清华大学

申请日：2024-02-05

公开（公告）日：2024-04-09

公开（公告）号：CN117852654A

主分类号：G06N5/04

分类号：G06N5/04;G06N5/022;G06F18/22;G06N20/00;G06N5/01

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.26#实质审查的生效;2024.04.09#公开

摘要：本申请涉及一种模型训练方法和解决特定领域问题的方法，其中，模型训练方法包括：获取第一样本数据；第一样本数据包括N个第一问题文本和N个第一答案文本；根据第一样本数据和第一大语言模型，得到N个第一知识文本；根据第一样本数据中的至少部分数据和N个第一知识文本中的至少部分数据，对第一中间语言模型继续进行训练，得到第一语言模型；本申请提供的模型训练方法通过预训练一个应用于特定领域的小型语言模型，并利用大语言模型生成伪数据对该小型语言模型进行调整，可以得到能够生成针对特定领域问题的相关知识的第一语言模型，第一语言模型可以帮助大语言模型解决特定领域问题，提高大语言模型解决特定领域问题的能力。

主权项：1.一种模型训练方法，其特征在于，所述方法包括：获取第一样本数据；所述第一样本数据包括N个第一问题文本和N个第一答案文本；所述N个第一问题文本与所述N个第一答案文本一一对应；所述第一问题文本用于描述属于特定领域的第一问题；所述第一答案文本用于描述所述第一问题的答案；N为正整数；根据所述第一样本数据和第一大语言模型，得到N个第一知识文本；所述N个第一知识文本与所述N个第一问题文本一一对应；所述第一知识文本用于提供与回答所述第一问题相关的知识；根据所述第一样本数据中的至少部分数据和所述N个第一知识文本中的至少部分数据，对第一中间语言模型继续进行训练，得到第一语言模型；所述第一中间语言模型为应用于所述特定领域的预训练语言模型；所述第一语言模型的参数数量小于所述第一大语言模型的参数数量。

全文数据：

权利要求：

百度查询：清华大学一种模型训练方法和解决特定领域问题的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

下一篇：一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

相关技术

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

一种水泥砼搅拌机用振动下料装置_巢湖市恒峰建设工程有限公司_202322581391.8

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

摄像头安装组件和应用其的仪表屏_深圳市航盛电子股份有限公司_202322569773.9

一种盒式包装机输送机构_安徽从仁堂生物科技有限公司_202322459283.3

一种液压锁密闭性测试装置_靖江市长源液压机械有限公司_202322518953.4

一种煤矿井下局部通风机远程开停装置_贵州贵能投资股份有限公司_202322392209.4

一种耐泥沙高密封性水泵控制阀_国电龙达电力设备(天津)有限责任公司_202322437322.X

一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

一种双卧轴连续式混凝土搅拌装置_广安金都混凝土有限公司_202322291527.1

龙图腾网&IPTOP

【发明公布】一种模型训练方法和解决特定领域问题的方法_清华大学_202410166430.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务