买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】文本生成方法和文本生成装置_北京捷通华声科技股份有限公司_202311793486.4 

申请/专利权人:北京捷通华声科技股份有限公司

申请日:2023-12-22

公开(公告)日:2024-03-22

公开(公告)号:CN117744603A

主分类号:G06F40/166

分类号:G06F40/166;G06F16/31;G06F16/2457

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.09#实质审查的生效;2024.03.22#公开

摘要:本申请提供了一种文本生成方法和文本生成装置。该方法包括:获取第一目标文本的索引;根据第一目标文本的索引和第一列表中的分值排名前M的单词序列的索引,预测单词的索引,确定本轮的单词序列的索引;按照单词序列的分值从高到低的顺序,对以及前面所有轮的第一目标单词序列的索引以及本轮的单词序列的索引中不满足预设条件的单词序列的索引进行排序,将排序后的单词序列的索引放入第一列表;将本轮的单词序列的索引中满足预设条件的单词序列的索引放入第二列表;确定第二列表中分值最高的单词序列的索引为第二目标文本的索引。该方法解决了现有技术中确定下一轮的单词序列仅考虑本轮分值高的单词序列,导致最优解被抛弃概率增大的问题。

主权项:1.一种文本生成方法,其特征在于,所述方法包括:获取步骤,获取第一目标文本的索引,所述第一目标文本的索引由多个单词的索引组成;预测步骤,根据所述第一目标文本的索引和第一列表中的分值排名前M的单词序列的索引,预测单词的索引,确定本轮的所述单词序列的索引,所述单词序列的索引由至少一个单词的索引组成,前一轮的所述单词序列包含的单词的数量等于前一轮的轮次,本轮的所述单词序列包含的单词的数量等于本轮的轮次,所述单词序列的分值表示所述单词序列符合所述第一目标文本的语义的程度,M为正整数;筛选步骤,按照所述单词序列的分值从高到低的顺序,对以及前面所有轮的第一目标单词序列的索引以及本轮的所述单词序列的索引中不满足预设条件的所述单词序列的索引进行排序,将排序后的所述单词序列的索引放入所述第一列表,所述第一目标单词序列为未包含在多个第二目标单词序列中的所述单词序列,所述第二目标单词序列为由本轮的所述单词序列拆分成的所述单词序列,且一个所述第二目标单词序列的第一个单词与本轮的一个所述单词序列的第一个单词相同,所述预设条件为所述单词序列的最后一个单词的索引的为预设索引,所述预设索引表示文本结束;放入步骤,将本轮的所述单词序列的索引中满足所述预设条件的所述单词序列的索引放入第二列表;重复步骤,依次重复所述预测步骤、所述筛选步骤和所述放入步骤至少一次,直至所述第二列表中的所述单词序列的索引的数量为M;确定步骤,确定所述第二列表中分值最高的所述单词序列的索引为第二目标文本的索引。

全文数据:

权利要求:

百度查询: 北京捷通华声科技股份有限公司 文本生成方法和文本生成装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术