买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于深度神经网络的医疗卫生机构信息数据标准化方法_广州中康数字科技有限公司_202410040178.2 

申请/专利权人:广州中康数字科技有限公司

申请日:2024-01-10

公开(公告)日:2024-04-12

公开(公告)号:CN117874299A

主分类号:G06F16/901

分类号:G06F16/901;G06F16/29;G06F16/25;G06F16/28;G06F16/215;G06N5/022;G06N3/045;G06N3/08;G06F18/10;G06F18/24;G06F18/214

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.30#实质审查的生效;2024.04.12#公开

摘要:本发明公开了一种基于深度神经网络的医疗卫生机构信息数据标准化方法,包括构建地址元素知识图谱和抽取深度主动地址要素抽取两个部分;构建地址元素知识图谱部分主要是建设与维护地址知识,包括知识图谱的构建与自学习;抽取深度主动地址要素部分主要是从医疗医疗机构的名称及地址中对地址的关键元素进行抽取,基于NLP的文本处理思想,采用深度神网络模型进行处理,具体包括地址主动标注策略与深度地址要素抽取模型。本发明可实现高效、有效的医疗卫生机构信息数据标准化。

主权项:1.基于深度神经网络的医疗卫生机构信息数据标准化方法,其特征在于,具体包括如下步骤:S1、由专业人员收集通用地址区域关系和医疗卫生机构的原始信息数据;S2、对结构化数据,即通用地址区域关系进行初始化,构建地址元素图谱;所述地址元素图谱设置为八层,具体包括:第一层为经纬层,节点内容为具体地址对应的纬经度信息;第二层为地址层,节点内容为具体地址,表示上层节点路径的具体地址;第三层为村层,表示行政区分级中的第五层结构,包括居委会、村委会;第四层为镇层,表示行政区分级中的第四层结构,包括镇、乡、街道;第五层为区层,表示行政区分级中的第三层结构,包括区、地级市;第六层为市层,表示行政区分级中的第二层结构,包括市;第七层为省层,表示行政区分级中的第一层结构,包括省、直辖市;第八层为国家层,表示国家概念的根节点;记初始化后的地址元素图谱为G_0;初始化时,地址元素图谱各层具体的规则如下:第八层只初始化一个根节点;第三层到第七层采用国家统计局行政区划分来进行初始化,完成省、市、区、镇、村五层的数据初始化;第二层的初始化,是根据第三层到第七层形成的完整名称,通过开放地理信息API或企业注册网站获取医生卫生机构的具体地址;第一层的初始化,是对第二层的具体地址进行经纬度转换,获得经纬度数据;S3、地址元素图谱自学习:某一轮地址元素自学习具体过程如下:S3.1、加载全量医疗卫生机构信息数据raw_data,获取其中的地理信息的相关内容,保存在a_map_infos表中;S3.2、加载训练好的深度神经网络模型,即深度地址要素抽取模型NN_Model,遍历raw_data,记raw_data的每条记录为raw_x,对每条记录利用模型NN_Model进行预测,seq_list=NN_Modelraw_x,解释地址元素实体,预测结果保存在e_set_infos表中;S3.3、把a_map_infos表与e_set_infos表根据主键关联起来,形成表e_table_infos;S3.4、遍历e_tables_infos表中的元素,形成遍历的时序列e_seq_x,元素记为elmnt;按e_seq_x时序列与地址元素图谱G_0进行自上而下进行匹配,如果完全匹配,从地址元素图谱G_0中取出元素记为std_elmnt,并转到步骤S3.6,如果不完全匹配转向步骤S3.5,否则结束;匹配过程中需要严格按照顺序,类型与文本均一致即为匹配成功;S3.5、获取不匹配的层号,并列出其所有孩子分支的经纬度,得到列表kg_map_als;获取e_seq_x对应地址的经纬度map_al,将map_al与kg_map_als中各个元素分别计算距离,取距离最小值mid_dist对应的元素记录为两元素三元组,关系是共现,记为elmnt,std_elmnt,co_occur,其中两个经纬度的距离计算公式为: 其中,R表示地球半径,表示两个地址的经纬坐标;S3.6、以上层节点作为条件,对地址元素进行频率统计;S3.7、合并全库地址元素对,并计算地址元素与地址元素图谱中标准地址元素的相似度分布,具体公式为: 其中,freq·为频率统计操作;S3.8、把计算的相似度更新到地址元素图谱中,完成本轮学习。

全文数据:

权利要求:

百度查询: 广州中康数字科技有限公司 基于深度神经网络的医疗卫生机构信息数据标准化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。