【发明公布】一种基于词典的文本蕴含式生物医学命名实体识别方法_杭州电子科技大学_202311018938.1

申请/专利权人：杭州电子科技大学

申请日：2023-08-14

公开（公告）日：2023-12-22

公开（公告）号：CN117272997A

主分类号：G06F40/295

分类号：G06F40/295;G06F40/242;G06N3/0455;G06N3/0895

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.01.09#实质审查的生效;2023.12.22#公开

摘要：本发明公开了一种基于词典的文本蕴含式生物医学命名实体识别方法，该法首先从词典中收集包含实体名称和实体类型的实体词典，作为真实标签。其次对输入的句子构建对应的文本蕴含对，并通过设定负样本例正样本例的比率以控制负蕴含对的采样数量。然后构建蕴含编码器，对输入的蕴含对进行编码，并结合动态对比学习方法进行模型训练。最后预测输入的语句时，模型将所有正的蕴含对识别为实体，如果有子序列具有多个不同实体类型的正蕴含对，则把相似度最高的标签作为最终标签。本发明可以在没有完整标注的情况下缓解噪声标签问题，能从预训练的文本蕴含模型中迁移知识，并对命名实体进行精确的识别。

主权项：1.一种基于词典的文本蕴含式生物医学命名实体识别方法，其特征在于，包括以下步骤：步骤一，从词典中收集包含实体名称和实体类型的实体词典，作为真实标签，获得弱监督；步骤二，对输入的句子构建对应的文本蕴含对；步骤三，使用RoBERTa模型对输入的文本蕴含对进行编码，RoBERTa模型的每个Transformer编码器层都包含了横跨整个输入句子的双向注意力；步骤四，将文本蕴含与动态对比学习算法相结合，对零样本生物医学命名实体识别任务进行RoBERTa模型训练；步骤五，预测输入的语句时，模型将所有正的文本蕴含对识别为实体，如果有子序列具有多个不同实体类型的正文本蕴含对，则把相似度最高的标签作为最终标签，完成识别。

全文数据：

权利要求：

百度查询：杭州电子科技大学一种基于词典的文本蕴含式生物医学命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种水泥搅拌机防尘装置_安徽卓恰建筑科技有限公司_202322417695.0

下一篇：一种用于公路施工的防撞装置_江苏常鑫路桥集团有限公司_202322375940.6

相关技术

一种水泥搅拌机防尘装置_安徽卓恰建筑科技有限公司_202322417695.0

一种用于公路施工的防撞装置_江苏常鑫路桥集团有限公司_202322375940.6

一种熔体滤芯圆周端面焊接装置_河南省菲优特过滤设备有限公司_202322606165.0

一种带有调节机构的抗震支架_陕西开天实业有限公司_202322564448.3

一种韭菜种植浸泡催芽装置_马鞍山市怡和园农业发展股份有限公司_202322402443.0

一种多角度可调式监控器_杭州阳宁实业有限公司_202322553745.8

微光与长波红外双波段共口径光学系统_烟台艾睿光电科技有限公司_202322432284.9

一种机械模具锯加工废屑清理装置_青岛宁力盛机械有限公司_202322603197.5

换向阀铸造模具_烟台古河智能装备有限公司_202322526540.0

一种污水处理用药剂投放机_常州市尚明环保科技有限公司_202322438903.5

一种深基坑支撑梁架结构_福建省岩田基建工程技术有限公司_202322458916.9

雷达安装结构及车辆_长城汽车股份有限公司_202322575661.4

龙图腾网&IPTOP

【发明公布】一种基于词典的文本蕴含式生物医学命名实体识别方法_杭州电子科技大学_202311018938.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务