买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于深度SKIP-GRAM网络的文本分类的系统和方法_百度(美国)有限责任公司_201911100393.2 

申请/专利权人:百度(美国)有限责任公司

申请日:2019-11-12

公开(公告)日:2023-06-09

公开(公告)号:CN111753081B

主分类号:G06F16/35

分类号:G06F16/35;G06F18/2411;G06F18/2415;G06N3/0442;G06N3/0464;G06N3/08

优先权:["20190328 US 16/368,440"]

专利状态码:有效-授权

法律状态:2023.06.09#授权;2020.10.30#实质审查的生效;2020.10.09#公开

摘要:本文中描述的是用于将结合skip‑gram卷积来提取非连续本地n‑gram模式以用于改变文本表达的综合信息的系统和方法的实施方式。在一个或多个实施方式中,采用一个或多个循环神经网络经由链状架构以从局部水平到顺序和全局水平的方式提取长程特征。对广泛用于文本分类任务的大规模数据集进行了综合实验以表明所提出的深度skip‑gram网络实施方式的有效性。对各种数据集的性能评估表明skip‑gram网络的实施方式对于一般文本分类任务集是强大的。skip‑gram模型是稳健的,并且可在不同的数据集上很好地概括,甚至不需要调整特定数据集的超参数。

主权项:1.用于使用一个或多个处理器进行文本分类以使得以下步骤被执行的计算机实现的方法,所述步骤包括:生成一组skip-gram序列,其中所述一组skip-gram序列包括具有来自包括一个或多个词的文本输入的非连续标记并且具有相关的ground-truth类别标签的至少一个skip-gram序列;将每个skip-gram序列转换成相应的词向量;通过skip-gram卷积模块、至少基于每个skip-gram序列的词向量而分别为每个skip-gram序列生成单独的skip-gram特征图,所述单独的skip-gram特征图根据相应的skip-gram序列的起始位置和总跳跃大小来分组;对每组单独的skip-gram特征图执行最大池化以生成用于所述组的代表性特征图;在循环模块处使用每组的所述代表性特征图生成一个或多个隐藏状态;使用softmax层基于所述一个或多个隐藏状态来生成用于所述文本输入的类别的概率分布;以及基于所述相关的ground-truth类别标签和所述类别的概率分布来计算损失,以更新用于所述skip-gram卷积模块和所述循环模块中的至少一个的参数。

全文数据:

权利要求:

百度查询: 百度(美国)有限责任公司 基于深度SKIP-GRAM网络的文本分类的系统和方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。