【发明公布】一种基于迁移学习与专家反馈的照护问答模型训练方法_华东师范大学_202311528596.8

导航：龙图腾网> 最新专利技术> 一种基于迁移学习与专家反馈的照护问答模型训练方法_华东师范大学_202311528596.8

申请/专利权人：华东师范大学

申请日：2023-11-16

公开（公告）日：2024-02-09

公开（公告）号：CN117542471A

主分类号：G16H20/00

分类号：G16H20/00;G16H70/20;G06F16/332;G06F40/247;G06F40/166;G06F40/253;G06F21/62;G06F40/30;G06F16/901;G06N20/00;G06N3/096;G06N5/022

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.03.01#实质审查的生效;2024.02.09#公开

摘要：本发明公开了一种基于迁移学习与专家反馈的照护问答模型训练方法，一方面，为照护领域设计了一种基于迁移学习的知识增强方法，首先通过构建和优化语义层级树，生成医学语义片段；然后利用低秩自适应算法及大规模医学数据集，训练得到迁移模型；最后利用迁移模型将医学语料迁移到照护领域。该过程改善了医学语言模型在照护场景中存在的领域偏移、交流模式差异、临床实践细节缺失等难题，使得模型在照护问答场景中表现地更专业、更精准。另一方面，采用直接偏好优化算法和最大熵采样策略相融合的主动学习策略，有效引入了专家反馈、人在回路的机制；实现了模型的持续优化和知识更新，保证了照护问答系统在生成质量、实时性和实用性方面的能力提升。

主权项：1.一种基于迁移学习与专家反馈的照护问答模型训练方法，其特征在于，包括以下步骤：步骤1：构建医学照护语料库，包括如下子步骤：1-1：构建通用医学照护数据集和专业照护数据集；其中，所述通用医学照护数据集包括照护典籍、照护科研文献、临床照护实践指南，以及健康照护数据库；所述专业照护数据集包括照护机构的专业照护日志及机构内部知识库；1-2：专家参与的语料质量检查；由医学领域的专业人员对收集到的照护语料进行评估和检查，从专业性、有效性及正确性进行质量把控，使每一份数据满足模型构建和训练的要求；步骤2：数据质量优化，包括以下子步骤：2-1：文本增强处理；应用基于简单数据增强算法的文本增强处理技术，来丰富和优化通用医学照护数据集和专业照护数据集；具体包括：同义词替换；随机插入；随机交换；随机删除；2-2：数据清洗和优化；包括：数据去重；语法纠正；格式校对；隐私保护；步骤3：面向照护领域的迁移学习3-1：构建语义层级树：根据医学照护数据集和专业照护数据集，生成一个结构化的4元组语义层级树，以组织和表示语料的知识；其中，正文作为叶子节点，包含具体的信息和知识，而其他标题作为非叶子节点，用于组织和分类正文内容；3-2：语义层级树扁平化；将步骤3-1生成的语义层级树进行扁平化处理；从每个叶子节点追溯到根节点，建立一系列遍历路径，使得每个路径都成为一条独立的医学语义片段；3-3：训练医学照护迁移模型：以智谱AI的ChatGLM-6B为基础模型，利用47万高质量的医学数据集DISC-Med-SFT，通过低秩自适应算法将DISC-Med-SFT中的医学数据注入语言模型进行深度定制化训练，以增强语言模型从医学领域向照护领域迁移时的性能表现；预训练语言模型加入低秩自适应模块后的前向传播公式为：y＝Wx+BAx其中，W表示预训练语言模型全连接层，其维度为d,d，x表示输入，y表示输出，矩阵A的维度为d,4，矩阵B的维度为4,d；矩阵A使用随机高斯分布初始化，矩阵B使用全0初始化；3-4：将步骤3-3得到的医学照护迁移模型，应用于步骤3-2生成的医学语义片段，进行医学语料到照护领域的迁移；迁移过程中根据规定的规则和格式，动态筛选出高质量的照护语料，保存至输出文件；同时，设置健全的错误处理和异常捕获逻辑，确保迁移过程的稳定执行；步骤4：基于直接偏好优化算法和最大熵采样的主动学习标注策略4-1：采用最大熵采样作为查询策略，从用户提问中挑选出信息量丰富、具有高标记价值的问题；其中，最大熵采样的计算公式为：其中，x表示模型输入，y表示输出，i表示样本编号，θ表示模型参数，p表示概率，argmin表示求最小值的索引；4-2：质量评价：对步骤4-1筛选出的问答对，由医学专家从准确性、可信度、客观性和用户体验角度进行评估和修正，得到专家反馈数据；4-3：三元组构建：每个被选中的问题和其对应的答案，将与步骤4-2得到的专家反馈数据，组成一个包含问题、专家反馈数据和语言模型响应的三元组；4-4：使用直接偏好优化算法将医学专家的反馈与生成式语言模型进行对齐；优化目标是计算当前模型中优选和被拒绝响应的对数概率，再微调模型参数，以提高优选响应的可能性，降低被拒绝响应的可能性；直接偏好优化算法的优化目标为：其中，σ表示逻辑斯蒂函数，X表示输入，Yi,1表示优选输出，Yi,2表示次选输出，θ表示模型参数，β表示可调节的超参数，Z表示正则项，i表示样本编号，p表示概率，θ,表示初始参数，L表示损失函数，r表示中间函数；步骤5：构建知识缓存区，增强语言模型的知识检索和响应能力5-1向量化和知识存储；利用m3e-large模型，将步骤3-2生成的医学语义片段转化成词向量形式，实现知识的高效表示和存储；将生成的词向量嵌入至Faiss数据库中，该数据库用于稠密向量的高效检索和聚类；5-2实现知识嵌入接口；知识嵌入接口用于处理用户查询：从Faiss数据库中精选出与用户查询最匹配的数条数据，将作为提示词，辅助语言模型生成更为精准和相应的回答；步骤6：将步骤5得到的模型部署在服务器上。

全文数据：

权利要求：

百度查询：华东师范大学一种基于迁移学习与专家反馈的照护问答模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

下一篇：一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

相关技术

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

一种能自动清洗的鸡养殖笼_海南省农业科学院三亚研究院(海南省实验动物研究中心)_202420555494.9

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

一种点火线圈密封结构_一汽解放汽车有限公司_202322812056.4

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种万寿菊用大型烘干机_丘北立达尔生物科技有限公司_202322498434.6

一种方便拆装的瓦楞机用瓦楞辊_浙江永暉瓦楞辊有限公司_202322675014.0

一种防卡管测斜仪探头_中国建筑西南勘察设计研究院有限公司_202420526288.5

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

照护相关技术

基于图神经网络与深度学习的失能老人照护方案推荐方法_复旦大学_202410003596.4

一种照护演示台_广州松田职业学院_202322118382.5

一种防跌落的老年人照护用护理床_嘉兴南洋职业技术学院_202321978112.5

支撑主模块及步行装置、复健照护机、步行照护机_全能照护科技股份有限公司_202321131421.9

一种老年照护数据知识图谱的构建方法及系统_山东大学_202110990134.2

一种新生儿家庭照护护理装置_中国人民解放军陆军军医大学第一附属医院_202311569256.X

一种用于老年人预立医疗照护计划的自助咨询平台_山西省汾阳医院_202311126485.4

可分割的牙用照护产品、头部及零件套组_TEPE 口腔卫生产品公司_202280046450.7

模拟仿真智能婴幼儿照护模型_深圳咕嘟熊教育科技有限责任公司_202321830659.0

照护辅助系统及方法、照护辅助信息登记系统及方法_赛尔帕有限公司_202080003096.0

问答相关技术

视频问答方法及电子设备_华为技术有限公司_202211289300.7

问答机器人健康度评估方法、装置、设备及存储介质_平安银行股份有限公司_202111150154.5

基于指令微调和检索增强生成的在线智能问答方法及装置_杭州有赞科技有限公司_202410118530.X

基于知识图谱的柑橘管控问答模块构建方法及问答系统_华南农业大学_202111387891.7

智能问答模型优化方法及装置_中国银行股份有限公司_202010830599.7

汽车知识问答方法、装置、电子装置和存储介质_浙江凌骁能源科技有限公司_202311759434.5

一种生成式问答的评价方法_北京工业大学_202110184397.4

客服智能问答实现方法、装置、设备及存储介质_深圳市闪剪智能科技有限公司_202311868260.6

一种作业问答方法、装置、客户端、设备及介质_深圳市酷开网络科技股份有限公司_202311709143.5

一种面向医疗知识图谱问答的问句解析方法_武汉科技大学_202111170907.9

反馈相关技术

堵纸反馈结构、堵纸反馈模块及垫材成型机_杭州丙甲科技有限公司_202322463771.1

基于码本的反馈方法及设备_北京三星通信技术研究有限公司_202010403989.6

用于控制反馈传输的定时的方法和装置_瑞典爱立信有限公司_202011379830.1

混合自动报告请求反馈的方法和设备_OPPO广东移动通信有限公司_202210656075.X

柔性机械臂的姿态反馈方法、装置、计算机设备及介质_万勋科技(深圳)有限公司_202211296191.1

一种开关电源单串LED短路检测反馈电路_常州星宇车灯股份有限公司_201710733916.1

基于日志反馈的中文医学术语自适应对齐方法_广州中康数字科技有限公司_202310647595.9

一种短路电流反馈限制的输出级控制电路及其应用_江苏润石科技有限公司_202410160076.4

一种原边反馈变换器及开关控制方法_南京理工大学_202110967598.1

一种带有触摸振动反馈的超薄智能中控屏_厦门立林科技有限公司_202322606870.0

龙图腾网&IPTOP

【发明公布】一种基于迁移学习与专家反馈的照护问答模型训练方法_华东师范大学_202311528596.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务