申请/专利权人:渊慧科技有限公司
申请日:2018-05-22
公开(公告)日:2024-03-29
公开(公告)号:CN117787346A
主分类号:G06N3/0464
分类号:G06N3/0464;G06N3/0475;G06N3/084;G10L13/08;G10L25/30
优先权:["20170520 US 62/509,053"]
专利状态码:在审-实质审查的生效
法律状态:2024.04.16#实质审查的生效;2024.03.29#公开
摘要:公开了一种前馈生成式神经网络,该前馈生成式神经网络生成在单个神经网络推理中包括特殊类型的多个输出示例的输出示例。可选地,生成可以以上下文输入为条件。例如,前馈生成式神经网络可以生成语音波形,语音波形是以文本片段的语言特征为条件的输入文本片段的语言化。
主权项:1.一种计算机实施的前馈生成式神经网络110,被配置为生成语音波形112,所述语音波形包括以表示文本输入102的特征的调节张量为条件以生成波形,使得所述语音波形是所述文本输入的语言化的多个样本;其中,所述前馈生成式神经网络包括一系列卷积神经网络层群组;其中,每个群组以所述调节张量为条件;其中,每个群组被配置为接收输入波形并将以所述调节张量为条件的波形转换成输出波形;其中,除第一群组之外的每个卷积神经网络层群组的输入波形是紧接在所述群组之前的群组的输出波形,其中,所生成的波形由最后一个卷积神经网络层群组的输出定义;以及用于生成随机噪声向量104的装置,所述随机噪声向量包括用于所述多个样本中的每个样本的噪声值;其中,第一卷积神经网络层群组的输入波形是所述随机噪声向量。
全文数据:
权利要求:
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。