买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于图谱的文本生成方法、系统、电子设备及存储介质_上海明略人工智能(集团)有限公司_202011417808.1 

申请/专利权人:上海明略人工智能(集团)有限公司

申请日:2020-12-07

公开(公告)日:2024-04-09

公开(公告)号:CN112559761B

主分类号:G06F16/36

分类号:G06F16/36;G06F40/166;G06F40/186

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2021.04.13#实质审查的生效;2021.03.26#公开

摘要:本发明提出一种基于图谱的文本生成方法、系统、电子设备及存储介质,其方法技术方案包括三元组排序步骤,基于一预设排序规则对构成图谱的三元组进行排序;冗余处理步骤,去除排序后的所述三元组的冗余信息,并基于一预设重组规则对所述三元组进行修改重组;文本生成步骤,分析修改重组后的所述三元组的关系词词性,并根据分析结果通过一预设文本模板生成文本。本发明解决了现有文本生成方法缺乏指代、信息冗余的问题。

主权项:1.一种基于图谱的文本生成方法,其特征在于,包括:三元组排序步骤,三元组由实体1、关系词、实体2组成,所述三元组生成的文本段落由多个句子组成,所述三元组排序步骤包括,有向图构建步骤,将所述三元组进行去重,并转换为一有向图结构,起始三元组确定步骤,按照每个实体节点的入度做升序排序,筛选出入度为0的实体,以同一所述实体为所述实体1的所述三元组之一作为同一句子的起始三元组,筛选出有向图中出入度同时不为0的实体节点,以所述实体节点为所述实体1的所述三元组作为一个新的句子的起始三元组,确定每个句子内的三元组并排序的步骤,选出与所述起始三元组中与所述实体1相同的三元组作为同一个句子中的内容,若各所述三元组中的所述关系词不同,则根据所述关系词的第一个字的拼音首字母进行排序,若各所述三元组中的关系词相同,则根据所述实体2中的第一个字的拼音首字母进行排序,句子顺序确定步骤,通过确定各句子中所述起始三元组中所述实体1的顺序,来辅助确定文本段中各句子之间的顺序,具体包括,根据入度为0的所述起始三元组中所述实体1的出度进行降序排序,对于出度和入度同时不为0的实体节点,根据入度进行降序排序,根据入度大小,依次将各句子中的所述三元组数据追加在上述步骤得到的所述三元组后;冗余处理步骤,去除排序后的所述三元组的冗余信息,并基于一预设重组规则对所述三元组进行修改重组,所述预设重组规则包括,链式结构三元组重组方法,将三元组中的共享实体替换为代词或空字符串,得到新的多个所述三元组,实体1并列三元组修改方法,多个所述三元组的所述实体1相同,将所述三元组中的共享实体替换为代词或空字符串,关系词和实体1同时并列三元组重组方法,将多个三元组合并为1个三元组,所述三元组中所述实体1与所述关系词不变,所述实体2修改为原始三元组中所有所述实体2的组合,关系词和实体2同时并列三元组重组方法,将多个所述三元组合并成1个三元组,所述三元组中所述关系词和所述实体2不变,所述实体1变为原始三元组中所有所述实体1的组合;文本生成步骤,分析修改重组后的所述三元组的关系词词性,并根据分析结果通过一预设文本模板生成文本。

全文数据:

权利要求:

百度查询: 上海明略人工智能(集团)有限公司 基于图谱的文本生成方法、系统、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。