【发明授权】对话式大语言模型监督训练评价系统_南京大经中医药信息技术有限公司_202410121885.4

导航：龙图腾网> 最新专利技术> 对话式大语言模型监督训练评价系统_南京大经中医药信息技术有限公司_202410121885.4

申请/专利权人：南京大经中医药信息技术有限公司

申请日：2024-01-30

公开（公告）日：2024-04-16

公开（公告）号：CN117648430B

主分类号：G06F16/332

分类号：G06F16/332;G06F18/241;G06N3/0464;G06N3/088

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2024.03.22#实质审查的生效;2024.03.05#公开

摘要：本发明公开了对话式大语言模型监督训练评价系统，涉及人工智能领域，改善了现有对话模型由于训练不到位造成语言模型出现回复效率低下、输出结果精度不足等问题的问题，包括数据获取模块：获取模型训练数据，初次训练模块：对对话式大语言模型进行初次训练，并获取模型训练数据，模型评价模块：根据模型训练数据计算模型评价系数进行语言模型分类，二次训练模块：根据语言模型分类数据对对话式大语言模型进行二次训练，本发明通过采用两次监督训练的方式对对话式大语言模型进行训练，能够有效提高对话式大语言模型的对话准确性和一致性，更好地满足用户对对话式大语言模型的需求。

主权项：1.对话式大语言模型监督训练评价系统，其特征在于，包括：数据获取模块：通过爬虫技术利用互联网获取中医领域数据，通过基于人工智能的对话生成模型对中医领域数据进行处理，得到模型训练数据；初次训练模块：根据模型训练数据对对话式大语言模型进行初次训练，得到初次训练质量数据，针对初次训练质量数据通过混淆矩阵得到对话式大语言模型的对话准确率和对话召回率，利用对话式大语言模型的对话准确率和对话召回率计算得到对话式大语言模型的F1值；模型评价模块：分别根据对话式大语言模型的对话准确率、对话召回率以及F1值计算得到模型评价系数，并对模型评价系数进行阈值划分，得到语言模型分类数据；二次训练模块：根据语言模型分类数据对对话式大语言模型进行二次训练；还包括服务器，所述数据获取模块、初次训练模块、模型评价模块和二次训练模块分别与服务器相连；所述模型评价模块根据初次训练质量数据计算模型评价系数进行语言模型分类，具体如下：模型评价模块包括评价系数单元和评价分级单元；评价系数单元根据初次训练质量数据计算模型评价系数；评价分级单元根据模型评价系数进行语言模型分类；由模型评价系数和模型评价系数阈值数据判断的结果得到语言模型分类数据；所述评价系数单元计算模型评价系数，具体如下：根据初次训练质量数据获取对话式大语言模型的对话准确率、对话召回率和F1值；根据对话式大语言模型的对话准确率、对话召回率和F1值计算模型评价系数Pj；分别获取n个对话式大语言的评价系数；所述评价分级单元对语言模型进行分类，具体如下：根据初次训练质量数据分别获取n个对话式大语言模型的对话准确率、对话召回率和F1值；根据n个对话式大语言模型的对话准确率计算n个对话式大语言模型的平均对话准确率；根据n个对话式大语言模型的对话召回率计算n个对话式大语言模型的平均对话召回率；根据n个对话式大语言模型的对话F1值计算n个对话式大语言模型的平均对话F1值；根据n个对话式大语言模型的平均对话准确率、平均对话召回率和平均对话F1值通过评价系数阈值计算公式计算得到模型评价系数阈值数据Pj1；根据模型评价系数和模型评价系数阈值数据获取语言模型分类数据，具体如下：当Pj≥Pj1，判断对应对话式大语言模型为中医类高精度语言模型；当0＜Pj＜Pj1，判断对应对话式大语言模型为中医类低精度语言模型；所述二次训练模块对对话式大语言模型进行二次训练，具体如下：二次训练模块包括半监督学习单元和迁移学习单元；半监督学习单元对中医类低精度语言模型进行训练，具体如下：根据模型训练数据获取训练集数据和测试集数据；利用人工标注的方式对训练集数据中的问题和对应的正确回答进行标注，得到带有正确回答的训练数据样本并将作为标签数据，使用标签数据对中医类低精度语言模型进行初步训练；将训练集数据中未标注问题和回答的数据作为无标签数据，通过Self-Training对无标签数据进行预测，并获取预测结果置信度高并进行置信度高低判断，将置信度高的无标签数据加入标签数据，成为新的标签数据，由此反复迭代，提高中医类低精度语言模型的精度和性能；迁移学习单元对中医类高精度语言模型进行训练；所述迁移学习单元对中医类高精度语言模型进行训练，具体如下：根据模型训练数据获取训练集数据；在对中医类高精度语言模型进行无监督学习训练的基础上使用增量学习通过模型训练数据进行部分微调，针对输入的问题涉及的需求进行增量学习；使用部分微调后的中医类高精度语言模型对无标签数据进行预测，得到伪标签，将伪标签加入标签数据中，扩充训练数据，使用扩充后的数据集进行重新训练，调整模型参数；重复以上训练过程，对中医类高精度语言模型进行多次微调和自训练的迭代训练，以逐步提升模型在中医领域的性能和适应能力。

全文数据：

权利要求：

百度查询：南京大经中医药信息技术有限公司对话式大语言模型监督训练评价系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种园林绿化便携铲_马丽丽_202322375183.2

下一篇：一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

相关技术

一种园林绿化便携铲_马丽丽_202322375183.2

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

管带纠偏装置_武汉巨沣工程技术有限公司_202322765867.3

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种散热户外路灯灯头_中山市澳斯朗电控科技有限公司_202322819842.7

一种点火线圈密封结构_一汽解放汽车有限公司_202322812056.4

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种网格化终端旋转装置_北京国旺盛源智能终端科技有限公司_202322619930.2

一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

模型相关技术

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

结构识别模型训练、模型结构识别方法、设备及介质_北京燧原智能科技有限公司_202410090059.8

用于模型蒸馏的方法和装置_北京百度网讯科技有限公司_202011473804.5

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

一种手板模型用打磨设备_青岛诚品模型有限公司_202322254282.5

基于ARIMA模型的容量预测装置及其控制方法_上海新炬网络信息技术股份有限公司_202010209101.5

模型处理方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202011056384.0

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

利用模型增强的自监督学习_硕动力公司_202280060208.5

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

监督相关技术

一种执法监督管理巡查设备_武汉铂亚晨科技有限公司_202322808118.4

基于主题信息增强的弱监督方面类别检测方法_昆明理工大学_202210652339.4

一种基于对偶学习和辅助信息的无监督气象降尺度方法_成都信息工程大学_202410189155.8

基于文字辅助的半监督3D医学图像分割方法_中国海洋大学_202410096489.0

基于无监督迁移学习的泵类机械设备轴承故障诊断方法_中国人民解放军92578部队_202111182225.X

一种面向铁轨图像的半监督异物检测方法_东南大学_202110785139.1

一种基于图卷积网络和无监督域自适应的航空发动机剩余使用寿命预测方法_大连理工大学_202111362020.X

一种基于监督沉浸式智能监督学习系统用可调节环境式墙体_赛文(北京)教育科技有限公司_202322143259.9

基于远程监督关系抽取的肝癌信息标注系统_杭州电子科技大学_202311787038.3

对话式大语言模型监督训练评价系统_南京大经中医药信息技术有限公司_202410121885.4

训练相关技术

警务政策多功能训练装置_南京软明信息科技有限公司_202322181392.3

用于胸腔穿刺训练的服装_中日友好医院(中日友好临床医学研究所)_202322044819.5

一种足球训练辅助装置_山西铁道职业技术学院_202420196121.7

一种训练足球反弹率测量装置_天水师范学院_202410145976.1

一种步态康复训练机器人_苏州大学_201811359142.1

一种腿部恢复护理训练装置_鄂俊_202321448389.7

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

一种骨关节运动康复训练装置_山东大学齐鲁医院_202322393150.0

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

龙图腾网&IPTOP

【发明授权】对话式大语言模型监督训练评价系统_南京大经中医药信息技术有限公司_202410121885.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务