【发明授权】医学语义匹配模型的训练方法、医学知识匹配方法及装置_广州金域医学检验中心有限公司;广州医科大学_202111136021.2

申请/专利权人：广州金域医学检验中心有限公司;广州医科大学

申请日：2021-09-27

公开（公告）日：2024-04-09

公开（公告）号：CN113780006B

主分类号：G06F40/30

分类号：G06F40/30;G06F40/284;G06F18/214;G06F18/22

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2024.01.26#著录事项变更;2021.12.28#实质审查的生效;2021.12.10#公开

摘要：本发明公开了医学语义匹配模型的训练方法、医学知识匹配方法及装置，该方法包括：在模型训练过程中，使用医学领域的文本对预训练语言模型进行语义训练，得到医学语义分析模型。通过医学语义分析模型的编码器生成每个样本对的两个第一句子级语义向量，再计算转换得到的两个第一句子级语义向量间的相似度，根据第二损失函数计算第二损失值并调整医学语义分析模型中的参数，以得到医学语义匹配模型。在应用过程中，通过文本库建立向量化知识库，再根据需求自行选择需要的模型并结合向量化知识库来进行高精度的匹配或粗精度的匹配，最后基于匹配结果及向量化知识库内的索引完成对匹配结果的输出，这样用户就快速找对与待匹配文本相关联的医学知识。

主权项：1.一种医学语义匹配模型的训练方法，其特征在于，所述方法包括：获取第一文本知识库和预训练语言模型，对所述第一文本知识库的文本进行实体全词覆盖，得到语义训练样本；所述第一文本数据库的文本包括多个检测报告文本和知识条目，所述实体全词覆盖用于隐藏所述文本中的至少一个词汇；使用所述语义训练样本对所述预训练语言模型进行语义训练，以预测在所述语义训练样本的覆盖位置处的词汇补全结果，根据所述词汇补全结果和第一损失函数计算第一损失值，根据所述第一损失值调整所述预训练语言模型中的参数，得到训练后的医学语义分析模型，所述预训练语言模型包括编码器和第一输出层，所述编码器用于提取语义向量，所述第一输出层用于根据所述编码器输出的语义向量输出所述词汇补全结果；获取多个样本对，所述多个样本对包括正样本对和负样本对，一个正样本对包括一个检测报告和一个匹配的知识条目，一个负样本对包括一个检测报告和一个不匹配的知识条目；通过所述医学语义分析模型中的编码器生成每个样本对的两组词语级语义向量，对所述每个样本对的两组词语级语义向量进行降维，得到每个样本对的两个第一句子级语义向量；所述两组词语级语义向量包括检测报告对应的一组词语级语义向量和知识条目对应的一组词语级语义向量，一组词语级语义向量包括多个词语级语义向量，一个词语级语义向量为一个字对应的多维度语义向量；通过与所述医学语义分析模型中编码器连接的第二输出层计算所述每个样本对的两个第一句子级语义向量间的相似度，根据所述相似度和第二损失函数计算第二损失值，根据所述第二损失值调整所述医学语义分析模型中编码器和所述第二输出层的参数，以增大正样本对的两个第一句子级语义向量间的相似度，且减小负样本对的两个第一句子级语义向量间的相似度，以得到训练后的医学语义匹配模型。

全文数据：

权利要求：

百度查询：广州金域医学检验中心有限公司;广州医科大学医学语义匹配模型的训练方法、医学知识匹配方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种盒式包装机输送机构_安徽从仁堂生物科技有限公司_202322459283.3

下一篇：一种钝化复合功能层和TOPCon电池_中环新能(安徽)先进电池制造有限公司_202322011797.2

相关技术

一种盒式包装机输送机构_安徽从仁堂生物科技有限公司_202322459283.3

一种钝化复合功能层和TOPCon电池_中环新能(安徽)先进电池制造有限公司_202322011797.2

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

一种矮轴gasket结构的机械键盘_渴创技术(深圳)有限公司_202322395230.X

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

一种高效型苗种植机_海南勤璞园农业科技有限公司_202322496666.8

一种农牧业通电线卷绕装置_山东恒通智能新材料有限公司_202322431480.4

龙图腾网&IPTOP

【发明授权】医学语义匹配模型的训练方法、医学知识匹配方法及装置_广州金域医学检验中心有限公司;广州医科大学_202111136021.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务