买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于表格层次化建模的结构化数据生成文本方法_哈尔滨工业大学_201910828514.9 

申请/专利权人:哈尔滨工业大学

申请日:2019-09-03

公开(公告)日:2019-11-29

公开(公告)号:CN110516213A

主分类号:G06F17/22(20060101)

分类号:G06F17/22(20060101);G06F17/24(20060101);G06F17/27(20060101);G06N3/04(20060101);G06N3/08(20060101)

优先权:

专利状态码:有效-授权

法律状态:2022.04.15#授权;2019.12.24#实质审查的生效;2019.11.29#公开

摘要:一种基于表格层次化建模的结构化数据生成文本方法,本发明涉及结构化数据生成文本方法。本发明的目的是为了解决现有结构化数据生成文本只利用了数据本身单一信息,无法衡量实体数据整体情况以及同类型数据的表现差异和多表格数据之间的利用不充分问题。一、将数据集的记录用三元组表示,分别对每条记录所属的行、列维度建模得到该记录的行向量、列向量,并引入时间轴,对不同日期的同类型数据建模得到该记录的时间向量;二、融合行向量、列向量和时间向量得到该记录新的向量表示;三、对每行记录的新向量进行均值池化得到新行向量;四、每个解码时刻,对三得到的向量进行解码,得到当前时刻每条记录的权重。本发明用于表格数据生成文本方法。

主权项:1.一种基于表格层次化建模的结构化数据生成文本方法,其特征在于:所述方法具体过程为:步骤一、将数据集中表格信息处理成三元组之后,每个三元组对应表格中一个记录,对于每个记录,进行行、列和时间维度的建模,对每个记录所属的行、列建模得到该记录用行信息表示该记录的行向量和用列信息表示该记录的列向量同时引入时间轴,对不同日期的同一类型数据进行建模,得到该记录时间表示的时间向量步骤二、将步骤一得到的行、列和时间维度向量融合成新的向量,分别计算列维度表示的得分向量、行维度表示的得分向量和时间维度表示的得分向量的注意力权重;基于列维度表示的得分向量、行维度表示的得分向量和时间维度表示的得分向量的注意力权重,计算得到融合后的新的向量表示步骤三、对同一行的融合后的新的向量表示进行均值池化,得到对同一行的融合后的新的向量表示进行均值池化后的行向量rowi;步骤四、在解码步骤t时刻,对步骤二得到的和步骤三得到的rowi进行解码,生成当前时候所有表格每个三元组的权重;三元组权重要生成文字有2个概率,一个是拷贝概率,一个是生成文字概率:拷贝概率就是三元组权重;比较三元组权重和生成文字概率大小,若三元组权重大于生成文字概率,则生成的文字就是拷贝当前的三元组的值;若三元组权重小于等于生成文字概率,则生成的文字就是将LSTM隐层映射到词表上,将词表中概率最大的文字作为生成字。

全文数据:

权利要求:

百度查询: 哈尔滨工业大学 一种基于表格层次化建模的结构化数据生成文本方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。