申请/专利权人:哈尔滨工业大学
申请日:2021-06-29
公开(公告)日:2021-09-14
公开(公告)号:CN113392629A
主分类号:G06F40/211(20200101)
分类号:G06F40/211(20200101);G06F40/284(20200101);G06F40/295(20200101);G06N3/04(20060101);G06N3/08(20060101)
优先权:
专利状态码:有效-授权
法律状态:2022.10.28#授权;2021.10.01#实质审查的生效;2021.09.14#公开
摘要:基于预训练模型的人称代词消解方法,涉及人工智能技术领域,针对现有技术中代词消解的准确率低问题,本申请模型使用基于排序的代词消解框架,对于一个待消解的代词,存在一个候选先行词的集合,对于每一个候选先行词进行消解打分,打分最高的候选先行词作为消解对象进行消解。本申请引入预训练模型,利用预训练模型使用大量无标注文本进行训练的特点,能够更好的捕捉上下文信息,有效提高代词消解的指标,从而更好的帮助下游任务,提高代词消解的准确率,并提高了代词消解的效率。
主权项:1.基于预训练模型的人称代词消解方法,其特征在于包括以下步骤:步骤一:利用预训练模型对待消解文本上下文进行建模,得到上下文相关的字向量;步骤二:对于存在代词的句子,将该句子以及该句子之前内容中的人名和最大名词片段进行识别,并将识别结果作为候选先行词,所述最大名词片段为连续名词的拼接;步骤三:将代词和候选先行词进行编码得到代词的文本片段向量和候选先行词的文本片段向量,然后将代词的文本片段向量和候选先行词的文本片段向量分别与设定的长度特征拼接得到代词的向量及候选先行词的向量;步骤四:根据上下文相关的字向量得到候选先行词的字向量,然后利用候选先行词的字向量以及代词的文本片段表示得到期望先行词的向量,最后将期望先行词的向量、代词的向量以及候选先行词的向量拼接后,通过前馈神经网络进行消解打分;步骤五:取消解打分最高的候选先行词作为消解对象进行消解。
全文数据:
权利要求:
百度查询: 哈尔滨工业大学 基于预训练模型的人称代词消解方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。