【发明授权】基于融合空间位置注意力机制的图表英语摘要生成方法_桂林电子科技大学_202111351738.9

申请/专利权人：桂林电子科技大学

申请日：2021-11-16

公开（公告）日：2024-03-26

公开（公告）号：CN114020900B

主分类号：G06F16/34

分类号：G06F16/34;G06F16/33;G06F16/31;G06N20/00

优先权：

专利状态码：有效-授权

法律状态：2024.03.26#授权;2022.02.25#实质审查的生效;2022.02.08#公开

摘要：本发明公开了一种基于融合空间位置注意力机制的图表英语摘要生成方法，包括1）创建图表英语摘要描述数据集；2）数据变量替换图表数据值；3）基于空间关系的词向量位置编码；4）采用DiverseBeamSearch搜索词向量结果。这种方法基于融合空间位置注意力机制，采用数据变量替换图表数据值、采用空间注意力机制的方式学习词之间的关系、增强词向量与词向量之间的空间位置关系和正确的词位置排序、采用DiverseBeamSearch搜索更好的词向量结果，能提高生成图表英语摘要的质量。

主权项：1.一种基于融合空间位置注意力机制的图表英语摘要生成方法，其特征在于，包括如下步骤：1创建图表英语摘要描述数据集：选择公开网站的数据作为模型训练的数据来源，创建图表英语摘要描述数据集，该数据集由条形图和折线图组成，采用爬虫框架抓取8300条数据，8300条数据分别包括广告业、农业、化工业、建造业、消费业、电子商务业、经济业、能源与环境业、金融与保险业、健康与医疗业、互联网业、生活业、媒体业、金属与电子业、房地产业、零售业、服务业、社会业、运动休闲业、科技与电信业、运输与物流业、旅行、旅游与酒店业22个行业的数据统计表格、表格标题和对图表描述的英语摘要，采用TransChartText的英语摘要生成任务通过给定结构化的数据生成描述性的英语摘要：模型输入的结构化数据由记录表组成，其中，每条记录表包括标题ri0、表格单元格的值ri1、列索引值ri2、图表的类型ri3，输出的w＝w1+.....+wi是基于图表的描述性英语摘要向量，i表示文本的长度，数据到英语摘要的生成概率权重如公式1、公式2所示：其中w＝w1+.....+wi表示生成的英语摘要向量、W表示模型参数；2数据变量替换图表数据值：采用数据变量替换图表数据值，在数据变量中定义七类数据变量，它们分别是标题实体变量、日期、x轴标签、y轴标签、表格单元格的数据、条形图和折线图趋势、占比，对于所定义的七个变量，采用命名识别构建变量模板数据库，在数据进入编码器的时候，首先，修改英语摘要，用预选设置的变量模板来替换摘要中的数值，将数值映射到某类别变量，然后，将修改后的摘要用来模型的训练和预测，最后，将生成的索引和预定义的数据变量进行匹配，生成摘要；3基于空间关系的词向量位置编码：采用空间注意力机制的方式学习词之间的关系，其中表示词向量ri的空间位置关系特征，表示词向量ri的词向量特征，表示词向量rj的空间位置关系特征，表示词向量rj的词向量特征，表示词向量ri与其它词向量之间的位置关系，在位置嵌入编码模块，对于向量ri，1≤i≤n，计算向量ri空间注意力权重，获取与其它单词的空间位置关系，并融合ri的词向量特征，作为向量ri的最终语义表示进行输出，定义如公式3所示进行变换操作：其中wA表示词向量的长度，计算给定单词向量ri和rj间的位置关系，定义如公式4所示计算空间位置注意力权重：其中表示ri的空间位置关系特征，表示rj的空间位置关系特征，εG是由cos和sin函数构成，在TransChartTextEncoder模块嵌入一组Relation模块，每个Relation模块都采用词向量空间位置特征作为输入，采用公式5学习与另外词向量之间的位置关系来更新词向量的表示：最后通过融合一组Relation模块得到并与当前模块的词向量特征进行融合，作为当前词向量的语义表示，计算公式如公式6所示：其中Concat表示对所有词向量进行拼接操作，Transformer编码模块不仅记录对应词向量与其它向量之间的位置关系，而且还采用Self-Attention更新语义信息表示，Self-Attention将词向量映射得到矩阵查询矩阵Q、键矩阵K和值矩阵V，计算方式如公式7所示：Q＝XWQ,K＝XWK,V＝XWV7，其中X表示输入的编码后的特征词向量，WQ，WK，WV表示权重矩阵，它们通过模型的训练获得，n个单向量的语义信息表示采用如公式8所示计算： Transformer词向量的编码器采用Multi-head-Attention将多个Self-Attention得到的语义信息进行拼接，计算方式如公式9所示：MultiHeadQ,K,V＝Concathead1,…,headhW9；4采用DiverseBeamSearch搜索词向量结果：最终采用DiverseBeamSearch搜索更好的词向量结果，Transformer解码器是根据编码器的输出词向量和上一个单词的词向量预测下一个单词，解码器通过条件概率选择当前时间序列局部最优的候选值加入单词序列y，解码器计算方式如公式10、11所示：θyt＝logPryt∣yt-1,...,y1,x10，其中x表示编码器的输出向量，yt表示在t时刻基于上一个单词预测的词向量，θyt表示当前词向量的条件概率、θyt的值取决于前t-1输出的词向量，y[t-1]，Θy[t]表示t个词向量的条件概率，采用DiverBeamSearch集束搜索算法，将Y[t]分成G组Yg[t]进行词序列的搜索，产生多个词序列进行选择，其中，g∈[G]，DiverBeamSearch算法中每一组有BG个候选词向量，引入ΔY[t]惩罚因子用来保证组与组之间的差异，DiverBeamSearch算法计算方式如公式12所示：其中λ是控制分组的惩罚项。

全文数据：

权利要求：

百度查询：桂林电子科技大学基于融合空间位置注意力机制的图表英语摘要生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种机柜_珠海冠宇动力电源有限公司_202322495779.6

下一篇：磨豆压力咖啡机自动压粉机构_浙江比依电器股份有限公司_202322521989.8

相关技术

一种机柜_珠海冠宇动力电源有限公司_202322495779.6

磨豆压力咖啡机自动压粉机构_浙江比依电器股份有限公司_202322521989.8

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

一种人参肽粉研磨设备_上海中盈经济发展(集团)有限公司_202322368406.2

管带纠偏装置_武汉巨沣工程技术有限公司_202322765867.3

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种园林绿化便携铲_马丽丽_202322375183.2

机制相关技术

基于过滤机制的视频解码方法_天津津航计算技术研究所_202110826187.0

一种手机制造用的可调节夹具_深圳市赛特尔通讯技术有限公司_202322489979.0

具有多位单元读取机制的设备及用于操作所述设备的方法_美光科技公司_202311291924.7

基于注意力机制与特征融合的图像检索方法_西安理工大学_202111501068.4

基于注意力机制的幽默文本分类方法、装置、设备、介质_中国平安人寿保险股份有限公司_202111433978.3

具有分层保护机制的半导体装置及相关系统、装置及方法_美光科技公司_201880069079.X

测试图卡、相机制造装置、相机的制造方法以及计算机可读记录介质_长川日本株式会社_202180004830.X

一种可调式发动机制动执行机构及其使用方法_东风商用车有限公司_201910222832.0

基于张量分解的车联网RIS辅助注意力机制通信与感知方法_上海师范大学_202211382306.9

一种机制岩棉净化板_安徽广雅新材料科技有限公司_202322398388.2

图表相关技术

PDF文档中图表的定位方法、装置及计算机设备_平安科技(深圳)有限公司_201910462305.7

一种图表生成方法、系统、终端及可读存储介质_深圳太极数智技术有限公司_202311719597.0

一种基于新能源场站地图图表的定位展示方法_北京华能新锐控制技术有限公司_202410056758.0

一种图表生成方法、装置、设备和存储介质_北京京东尚科信息技术有限公司_202011272941.2

一种基于三维场景的图表制作和呈现方法及装置_深圳艾迪普信息技术有限公司_202311715316.4

一种具备抵制过度平滑能力的自监督异质图表示学习方法_哈尔滨工业大学(威海)_202311451594.3

图表显示装置、图表显示方法以及记录介质_欧姆龙株式会社_202080004439.5

图表显示装置、图表显示方法以及记录介质_欧姆龙株式会社_202080004484.0

一种基于生成对抗网络的图表示学习方法和装置_浙江工业大学_202311632050.7

一种多视图双曲-双曲图表示学习方法_山西大学_202211602476.3

注意力相关技术

基于注意力机制的幽默文本分类方法、装置、设备、介质_中国平安人寿保险股份有限公司_202111433978.3

一种利用重映射注意力识别分心驾驶的方法_东南大学_202111564286.2

基于张量分解的车联网RIS辅助注意力机制通信与感知方法_上海师范大学_202211382306.9

基于融合注意力的宫颈细胞学图像异常区域定位方法及装置_华南理工大学_202210378225.5

力传感器_公益财团法人电磁材料研究所_202080022168.6

一种考虑索力耦合效应的索力优化方法、装置及设备_中铁大桥勘测设计院集团有限公司_202211074047.3

承受大径向力柱柱回转支承_马鞍山精一工程机械有限公司_202322356692.0

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种模拟划桨的滑轮回力组件_杭州竞航科技股份有限公司_202211159537.3

一种无侧向力的浮动平台_博众精工科技股份有限公司_201910565433.4

龙图腾网&IPTOP

【发明授权】基于融合空间位置注意力机制的图表英语摘要生成方法_桂林电子科技大学_202111351738.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务