Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜华南理工大学姜小波获国家专利权

恭喜华南理工大学姜小波获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜华南理工大学申请的专利一种基于偏移对角矩阵的Transformer加速器获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115329260B

龙图腾网通过国家知识产权局官网在2025-05-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210839287.1,技术领域涉及:G06F17/16;该发明授权一种基于偏移对角矩阵的Transformer加速器是由姜小波;莫志杰设计研发完成,并于2022-07-18向国家知识产权局提交的专利申请。

一种基于偏移对角矩阵的Transformer加速器在说明书摘要公布了:本发明提供了一种基于偏移对角矩阵的Transformer加速器,包括顶层控制模块、片上缓存模块、运算阵列和非线性函数单元;片上缓存模块用于存储输入数据、权重矩阵、运算中间结果和输出矩阵;权重矩阵采用偏移对角矩阵方式存储在片上缓存模块中;偏移对角矩阵包括非零值和偏移量;运算阵列用于从片上缓存模块读取输入数据和权重矩阵进行矩阵乘加运算;在运算阵列进行矩阵乘加运算时,运算阵列同时读取偏移对角矩阵非零值和偏移量,按照偏移量对非零值进行运算分配;非线性函数单元用于对输出矩阵进行非线性函数计算。该加速器可满足基于偏移对角结构化稀疏矩阵的Transformer模型加速,数据复用率高,负载均衡以及索引开销小。

本发明授权一种基于偏移对角矩阵的Transformer加速器在权利要求书中公布了:1.一种基于偏移对角矩阵的Transformer加速器,其特征在于:包括顶层控制模块、片上缓存模块、运算阵列和非线性函数单元;所述片上缓存模块用于存储输入数据、权重矩阵、运算中间结果和输出矩阵;权重矩阵采用偏移对角矩阵方式存储在片上缓存模块中;偏移对角矩阵包括非零值和偏移量;非零值和偏移量的获取方法是:将权重矩阵划分为大小相同的多个子矩阵,获取各个子矩阵的非零值,以及由各个子矩阵离对角线的偏移程度得到各个子矩阵的偏移量;所述运算阵列用于从片上缓存模块读取输入数据和权重矩阵进行矩阵乘加运算;在运算阵列进行矩阵乘加运算时,运算阵列同时读取偏移对角矩阵非零值和偏移量,以按照偏移量对非零值进行运算分配;所述非线性函数单元用于对输出矩阵进行非线性函数计算;在矩阵乘加运算完成后,将运算结果写回片上缓存,或者是将运算结果先输入非线性函数进行处理再写回片上缓存;所述运算阵列由若干运算单元组成;每个运算单元均包括若干个乘加器、数据分配器、单元输出缓存、量化模块、Relu函数模块和控制模块;每个运算单元的乘加器数量与子矩阵大小相同;每个乘加器均由相连接的乘法器和加法器组成;数据分配器将输入运算单元的偏移对角矩阵的非零值根据偏移量大小分配到相应的乘法器和加法器,且采用多播形式分配到乘法器;乘法器和加法器负责进行乘加运算;单元输出缓存负责存储的乘加运算结果;所述控制模块负责输出数据通路和计算模式信号的控制;根据控制模块输出的计算模式信号,单元输出缓存直接连接量化模块以将乘加运算结果直接量化后输出,或者是单元输出缓存通过Relu函数模块与量化模块连接以将乘加运算结果经过Relu函数模块的非线性激活后再量化输出;各个运算单元的输出结果进行累加后得到运算阵列的输出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。