买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于大数据的宫颈癌知识图谱构建方法_成都成电金盘健康数据技术有限公司;深圳成电金盘健康数据技术有限公司_202410089936.X 

申请/专利权人:成都成电金盘健康数据技术有限公司;深圳成电金盘健康数据技术有限公司

申请日:2024-01-23

公开(公告)日:2024-04-19

公开(公告)号:CN117910571A

主分类号:G06N5/025

分类号:G06N5/025;G06F16/36;G06F40/295;G16H50/70

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.07#实质审查的生效;2024.04.19#公开

摘要:本发明涉及基于大数据的宫颈癌知识图谱构建方法,属于电数字数据处理技术领域,可实现知识抽取阶段,通过基于GlobalPointer解码的实体关系联合抽取模型,相比于存在实体冗余、误差积累问题的管道式抽取模式,对于宫颈癌医学文本的实体识别和关系抽取效果有大幅提升;在知识融合阶段,通过基于召回+排序算法策略的实体对齐模型,对知识抽取阶段中宫颈癌各类医学文本中所抽取到的实体进行对齐,对不规范的实体实现了临床术语归一化,为后续高质量知识图谱的构建奠定了基础。

主权项:1.基于大数据的宫颈癌知识图谱构建方法,其特征在于,包括以下步骤:S1、本体构建,采用自顶向下的方式,即通过文献查阅法和专家咨询法联合构建宫颈癌知识图谱的本体;S2、数据标注,划分为四个流程:数据预处理、规范制定、预标注、正式标注;S3、知识抽取,根据宫颈癌医学文本特点、实体识别及关系抽取的任务特点,选取实体与关系联合抽取的方式;S4、知识融合,采用召回+排序的算法策略构建的实体对齐模型;先通过中文短文本相似度计算,得到TopN个候选标准词;再对候选标准词和诊断原词,构造一定比例的正负样本,基于BERT做文本匹配,最终完成对抽取出的医学实体的实体对齐;S5、知识存储,将经过融合的知识,即实体、实体与实体之间的关系以三元组的形式导入图数据库Neo4jGraphDatabase中,从而实现对宫颈癌知识图谱的存储与可视化。

全文数据:

权利要求:

百度查询: 成都成电金盘健康数据技术有限公司;深圳成电金盘健康数据技术有限公司 基于大数据的宫颈癌知识图谱构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术