买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】围产医学研究数据库构建方法及其系统_代科伟_202311582239.X 

申请/专利权人:代科伟

申请日:2023-11-23

公开(公告)日:2024-04-26

公开(公告)号:CN117520473B

主分类号:G06F16/31

分类号:G06F16/31;G06F16/33;G06F16/22;G06F18/22;G16H10/60;G06N3/0455;G06N3/0464;G06N3/0499;G06N3/045;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2024.04.19#专利申请权的转移;2024.02.27#实质审查的生效;2024.02.06#公开

摘要:本申请涉及围产医学技术领域,公开了一种围产医学研究数据库构建方法及其系统,该方法包括:对围产医学病历记录进行数据提取,得到医学文本词语;将医学文本词语输入至围产医学RoBERTa模型中,得到目标文本向量表示及其向量表示节点层级;按照向量表示节点层级将目标文本向量表示进行节点连接,构建单链围产医学研究数据树;计算任意两个叶子层级的目标文本向量表示的向量相似度;根据任意两个向量相似度进行节点连接,构建多链围产医学研究数据树;基于单链围产医学研究数据树和多链围产医学研究数据树,构建围产医学研究数据库。本申请提高了围产医学研究数据库的准确性和围产医学研究数据的查询效率。

主权项:1.一种围产医学研究数据库构建方法,其特征在于,包括:对每一个孕妇的围产医学病历记录进行数据提取,得到每一个孕妇的医学文本词语;所述医学文本词语包括孕妇信息词语、孕妇生理指标词语、胎儿生理指标词语、分娩方式信息词语和母婴健康结果词语;将每一个孕妇的医学文本词语输入至围产医学RoBERTa模型中,得到所述围产医学RoBERTa模型输出的目标文本向量表示及其向量表示节点层级;所述向量表示节点层级包括根节点层级和叶子层级;按照向量表示节点层级将每一个孕妇的目标文本向量表示进行节点连接,构建每一个孕妇的单链围产医学研究数据树;计算任意两个孕妇之间的叶子层级的目标文本向量表示的向量相似度;根据任意两个孕妇的向量相似度进行节点连接,构建任意两个孕妇之间的多链围产医学研究数据树;基于每一个孕妇的单链围产医学研究数据树和任意两个孕妇之间的多链围产医学研究数据树,构建围产医学研究数据库;其中,所述围产医学RoBERTa模型是基于围产医学文本样本及其对应的文本向量表示和向量表示节点层级训练得到;其中,所述计算任意两个孕妇之间的叶子层级的目标文本向量表示的向量相似度,包括:获取任意两个孕妇的叶子层级的目标文本向量表示中,处于同一叶子层级且同一分支节点的两个待匹配文本向量表示;其中,两个所述待匹配文本向量表示分别为第一待匹配文本向量表示si={w1,w2,…,wi}和第二待匹配文本向量表示rj={e1,e2,…,ej};获取所述第一待匹配文本向量表示si和所述第二待匹配文本向量表示rj之间的最大公共子串Commonwi,ej;基于所述第一待匹配文本向量表示si、所述第二待匹配文本向量表示rj和所述最大公共子串Commonwi,ej,计算两个待匹配文本向量表示之间的向量相似度;所述基于所述第一待匹配文本向量表示si、所述第二待匹配文本向量表示rj和所述最大公共子串Commonwi,ej,计算两个待匹配文本向量表示之间的向量相似度,包括:计算两个待匹配文本向量表示之间的单词相似度,具体公式为: 计算两个待匹配文本向量表示之间的匹配相似度,具体公式为: 基于所述单词相似度和所述匹配相似度,计算两个待匹配文本向量表示之间的向量相似度,具体公式为: 其中,WordSimsi,rj为单词相似度,TwoGramSimsi,rj为匹配相似度,RelSimsi,rj为向量相似度;所述围产医学研究数据库构建方法还包括:获取每一个孕妇的单链围产医学研究数据树中叶子层级中任意一个叶子节点的最大连接数量以及所有候选节点链路;基于每个候选节点链路的向量相似度计算每个候选节点链路的相关性评分,并根据每个候选节点链路的相关性评分对每个候选节点链路进行排序,得到排序后的节点链路;将排序后的节点链路中前最大连接数量的节点链路,确定为每一个孕妇的单链围产医学研究数据树中叶子层级中任意一个叶子节点的目标节点链路;每个候选节点链路的相关性评分的计算公式为: 其中,fsi,rj为相关性评分,n为候选节点链路对应的叶子节点的医学文本词语的长度。

全文数据:

权利要求:

百度查询: 代科伟 围产医学研究数据库构建方法及其系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。