买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于稳定性控制的医保统筹智能体的建模方法与系统_之江实验室_202311259740.2 

申请/专利权人:之江实验室

申请日:2023-09-27

公开(公告)日:2024-03-01

公开(公告)号:CN116994693B

主分类号:G16H10/60

分类号:G16H10/60;G16H40/20;G06N20/00;G06Q40/08

优先权:

专利状态码:有效-授权

法律状态:2024.03.01#授权;2023.11.21#实质审查的生效;2023.11.03#公开

摘要:本发明公开了一种基于稳定性控制的医保统筹智能体的建模方法与系统,周期性的对获取的包括DIPDRG分组点数和医院等级系数的患者真实数据进行汇总;结合医院和患者价值函数建立多周期时序性医保智能体强化学习模型并进行周期训练:在单个结算周期内将每次交互样本进行判断,分配到稳定经验池和波动经验池;在双经验池中进行随机采样,并更新损失函数直至奖励值收敛,将每周期输出结果作为下周期的初始状态;通过训练好的模型,得到下周期的DIPDRG分组点数和医院等级系数。本发明结合了医保周期结算的特点,在智能体的训练上采用了多周期训练方法,同时考虑相邻周期智能体输出在时序上的稳定性,提高了收敛速度,减少了数据波动。

主权项:1.一种基于稳定性控制的医保统筹智能体的建模方法,其特征在于,该方法包括以下步骤:S1、接收医保机构分组后的患者真实数据,其中包括DIPDRG分组点数和医院等级系数;S2、周期性的对获取的患者真实数据进行汇总;S3、结合医院价值函数和患者价值函数建立多周期时序性医保智能体强化学习模型;模型具体为:智能体状态空间由每个DIPDRG分组点数和多个医院对应的医院等级系数构成,智能体动作空间是由针对每个点数以及医院等级系数上下调整的动作构成;奖励函数根据患者价值函数、医院价值函数和医院超值结余金额,按照患方和院方医保资源分配合理性最大化为目标设置;所述患者价值函数通过诊疗费用和报销比例得到;所述医院价值函数通过获取的医保资源、患者报销费用和服务质量评价得到;S4、对多周期时序性医保智能体强化学习模型进行周期训练:使用深度Q值网络算法进行训练或者使用深度确定性的策略梯度算法进行训练,单个结算周期内,首先进行网络初始化,判断此次交互得到的奖励函数是否在稳定经验池的累计均值的上下一个方差内,若是则放入稳定经验池,否则放入波动经验池;在双经验池中进行随机采样,并更新损失函数直至奖励值收敛,每周期的输出状态作为下周期的初始状态;S5、将新的患者真实数据输入到训练好的多周期时序性医保智能体强化学习模型,得到下周期的DIPDRG分组点数和医院等级系数,进行医保分配。

全文数据:

权利要求:

百度查询: 之江实验室 一种基于稳定性控制的医保统筹智能体的建模方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。