申请/专利权人:国际商业机器公司
申请日:2020-06-12
公开(公告)日:2024-04-16
公开(公告)号:CN112084327B
主分类号:G06F16/35
分类号:G06F16/35;G06N3/0464;G06N3/094
优先权:["20190614 US 16/441,927"]
专利状态码:有效-授权
法律状态:2024.04.16#授权;2021.01.01#实质审查的生效;2020.12.15#公开
摘要:一种用于训练神经网络的方法、系统和计算机程序产品,所述方法包括:接收包含标注的部分和未标注的部分的文本语料库;从文本语料库中提取局部n元语法特征以及局部n元语法特征的序列;使用卷积层根据局部n元语法特征处理文本语料库,以确定被配置以保留局部n元语法特征的序列的胶囊的胶囊参数;使用胶囊参数执行胶囊之间的前向动态路由,以提取文本语料库的多个全局特征;以及使用长短期存储器层根据全局特征处理文本语料库,以从文本语料库提取多个全局顺序文本依赖关系,其中,根据局部n元语法特征、胶囊参数、全局特征和全局顺序文本依赖关系更新神经网络的参数。
主权项:1.一种训练神经网络以在保持语义的同时对稀疏标注的文本文档分类的方法,包括:接收文本语料库,文本语料库包含标注的部分和超出标注的部分的未标注的部分;从文本语料库中提取多个局部n元语法特征以及局部n元语法特征的序列;使用多个卷积层根据局部n元语法特征处理文本语料库,以确定被配置以保留局部n元语法特征的序列的多个胶囊的胶囊参数;使用胶囊参数执行多个胶囊之间的前向动态路由,以提取文本语料库的多个全局特征,其中,所述多个胶囊包括第一胶囊层中的胶囊和第二胶囊层中的胶囊,第二胶囊层中的每个胶囊的输入是由第一胶囊层中的胶囊的输出构成的;以及使用长短期存储器层根据全局特征处理文本语料库,以从文本语料库提取多个全局顺序文本依赖关系,其中,根据局部n元语法特征、胶囊参数、全局特征和全局顺序文本依赖关系更新神经网络的多个参数。
全文数据:
权利要求:
百度查询: 国际商业机器公司 在保留语义的同时对稀疏标注的文本文档的分类
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。