申请/专利权人:浙江大学
申请日:2024-01-29
公开(公告)日:2024-03-05
公开(公告)号:CN117649949A
主分类号:G16H70/20
分类号:G16H70/20;G16H20/00;G06F16/332;G06N3/092;G06F40/30
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.03.22#实质审查的生效;2024.03.05#公开
摘要:本发明公开了一种基于强化学习的临床思维数据生成系统及方法,该系统包括模态标识模块、模态决策模块、大模型诊断模块、奖励反馈模块和临床思维修饰模块。本发明利用强化学习方法生成多模态医疗数据输入的临床思维数据,依据生成过程中的状态、决策和奖励,优化生成策略,训练得到最优的临床思维数据的生成策略。通过本发明中的临床思维数据生成策略,能够对临床诊断过程中产生的临床诊断数据进行思维语义空间拓展,归纳其中的临床逻辑,解决临床诊断数据中无医务人员思维过程记录的问题。同时,融合多模态数据,保证了临床可信性,增强了临床诊断数据的临床可解释性。
主权项:1.一种基于强化学习的临床思维数据生成系统,其特征在于,包括:模态标识模块,用于对多模态医疗数据输入进行类别标签匹配,得到若干类别标签-数据键值对,形成模态标识组;模态决策模块,将模态标识组中当前用于诊断的医疗数据输入作为状态,选择类别标签作为决策,计算选择的类别标签对应的医疗数据输入进行诊断行为的奖励,基于强化学习方法训练状态-决策表,所述状态-决策表记录当前状态做出不同决策的置信度,训练目标是根据当前状态做出决策所对应的奖励,优化状态-决策表做出决策所使用的置信度;利用状态-决策表依据模态标识组生成临床决策数据和临床决策置信度;大模型诊断模块,用于对大模型发起对话,接收模态决策模块输出的临床决策,查询其在模态标识组中对应的输入,在多轮次对话场景下请求大模型做出临床诊断,得到疾病-症状-模态三元组集合形式的临床诊断结果;奖励反馈模块,用于构建疾病-症状-模态奖励矩阵,接收大模型诊断模块输出的临床诊断结果,在疾病-症状-模态奖励矩阵中查询所有三元组对应的奖励值,计算临床诊断结果中疾病诊断结果的奖励值,得到临床决策的奖励值,返回给模态决策模块;临床思维修饰模块,用于对多模态医疗数据输入的临床决策数据进行修饰,形成能够体现临床诊断决策过程的临床思维数据。
全文数据:
权利要求:
百度查询: 浙江大学 基于强化学习的临床思维数据生成系统及方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。