【发明授权】模型部署方法、模型部署装置、终端设备及可读存储介质_深圳市智芯华玺信息技术有限公司_202110567899.5

申请/专利权人：深圳市智芯华玺信息技术有限公司

申请日：2021-05-24

公开（公告）日：2024-03-22

公开（公告）号：CN113220457B

主分类号：G06F9/50

分类号：G06F9/50;G06N3/10;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.03.22#授权;2022.06.28#专利申请权的转移;2021.08.24#实质审查的生效;2021.08.06#公开

摘要：本发明公开了一种模型部署方法、模型部署装置、终端设备及可读存储介质，所述方法包括以下步骤：获取待部署深度神经网络模型的算子模型集合；将算子模型集合中满足预设条件的算子模型进行算子融合或算子分割处理，获得处理后的算子模型集合；获取所述处理后的算子模型集合中每个算子模型在用于部署模型的设备集合中的每个设备上的运行时间，获得运行时间集合；基于所述运行时间集合，采用预设搜索方法对所述处理后的算子模型集合中的算子模型进行组合，获得子模型集合；基于所述子模型集合，将待部署深度神经网络模型部署于所述设备集合上。本发明能够充分兼容不同算力的设备，可提高运行效率以及全局上的吞吐率。

主权项：1.一种模型部署方法，其特征在于，包括以下步骤：获取待部署深度神经网络模型的算子模型集合；将算子模型集合中满足预设条件的算子模型进行算子融合或算子分割处理，获得处理后的算子模型集合；获取所述处理后的算子模型集合中每个算子模型在用于部署模型的设备集合中的每个设备上的运行时间，获得运行时间集合；基于所述运行时间集合，采用预设搜索方法对所述处理后的算子模型集合中的算子模型进行组合，获得子模型集合；基于所述子模型集合，将待部署深度神经网络模型部署于所述设备集合上，完成模型部署；所述预设搜索方法为回溯法搜索方法；采用回溯法搜索方法对所述处理后的算子模型集合中的算子模型进行组合时，当实际运行时间大于等于高吞吐率优先方案的理论延时时，采用高吞吐率优先方案；所述高吞吐率优先方案具体步骤包括：将节点按输入-输出的拓扑结构依次编号，表示为Node1，Node2，...，Nodei，...，Noden；从Node1开始直到Noden，对Nodei查询拓扑图，获取与Nodei连通的分支节点，获得搜索树，对所述搜索树进行DFS遍历得到分割方案；其中，对Nodei的每个分支节点Nodei+1产生两个分支，用于表示Nodei与Nodei+1处于同一子模型和不同子模型；Nodei有多个分支节点时，找到所有分支节点汇聚的入节点Nodej，将除去Nodei到Nodej间节点以外分割方案相同的方案视为相同方案进行合并，获得最终的x个方案；遍历所述x个方案，对于某个方案，如果其需要的设备数量大于可用设备数目，则去掉该方案，获得现存的方案集合；遍历所述现存的方案集合：对于其中的每个方案，计算每一个子模型对应的算子模型在每种设备上的开销；将在不同设备上的开销进行组合，用最大的设备的开销乘以消耗的设备数量得到总的开销，找到使总的开销最小的一个组合作为最优组合，记为划分分割方案；比较所有划分分割方案的最小开销，将最小的最小开销对应的划分分割方案作为最终的划分分割方案。

全文数据：

权利要求：

百度查询：深圳市智芯华玺信息技术有限公司模型部署方法、模型部署装置、终端设备及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种具有服药求助警报功能的药丸储存项链_杨洁_202322091839.8

下一篇：一种耐泥沙高密封性水泵控制阀_国电龙达电力设备(天津)有限责任公司_202322437322.X

相关技术

一种具有服药求助警报功能的药丸储存项链_杨洁_202322091839.8

一种耐泥沙高密封性水泵控制阀_国电龙达电力设备(天津)有限责任公司_202322437322.X

一种接触器触头机构_杭州玛实迪电器科技有限公司_202322179096.X

整形压块及焊接装置_宁德时代新能源科技股份有限公司_202321970130.9

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种高效散热电源_广州市力为电子有限公司_202322175013.X

摄像头安装组件和应用其的仪表屏_深圳市航盛电子股份有限公司_202322569773.9

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

一种防堵污水管道_浩卓泵业(杭州)有限公司_202322092893.4

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

终端设备相关技术

折叠组件、折叠装置及终端设备_荣耀终端有限公司_202211521017.2

数据上报的方法及终端设备_荣耀终端有限公司_202211457859.6

数据处理方法、终端设备及系统_华为技术有限公司_202211289518.2

无线通信的方法、网络设备和终端设备_OPPO广东移动通信有限公司_201780092182.1

一种手写笔有线充电结构、终端设备_祖仲奇_202321497084.5

房间结构识别方法、装置、终端设备和可读存储介质_北京千丁互联科技有限公司_202110962473.X

应用程序文件的清理方法、装置、终端设备及存储介质_腾讯科技(深圳)有限公司_201910646199.8

一种悬置支架强度分析方法、装置、存储介质及终端设备_广州汽车集团股份有限公司_201910796558.8

控制信号获得方法、装置、终端设备以及存储介质_深圳市盈和致远科技有限公司_202111472097.2

一种用于展示用的可收放式终端设备_广西质量技术工程学校_202322801798.7

装置相关技术

发热装置及电子雾化装置_深圳市基克纳科技有限公司_202322129414.1

液体试剂供应装置及分析装置_东亚DKK株式会社_202010736498.3

操控装置、显示装置及车辆_小米汽车科技有限公司_202320552919.6

基板处理装置和流体加热装置_东京毅力科创株式会社_202311318777.8

定影装置及图像形成装置_富士胶片商业创新有限公司_202310510018.5

输入装置_欧姆龙株式会社_201980039113.3

台架装置_北京车和家汽车科技有限公司_202322479605.0

蓄电装置_丰田自动车株式会社_202210313089.1

气囊装置_株式会社斯巴鲁_202311232048.0

成像装置_天马日本株式会社_202311304060.8

部署相关技术

一种自动化代码合并及部署方法_北京智麟科技有限公司_202410063358.2

一种可视巡检机器人挂载部署装置_国网天津市电力公司_202110702538.7

集群部署方法及计算设备_超聚变数字技术有限公司_202311633791.7

模型优化部署方法、系统、设备及存储介质_北京大学_202110248323.2

虚拟化网络功能部署方法、装置和系统_西安华为技术有限公司_201911408221.1

部署鉴权方法、装置、设备及存储介质_北京奇虎科技有限公司_202410070167.9

基于图分割的工作流部署方法_西安电子科技大学_202210730454.9

模型部署方法、系统、电子设备以及存储介质_浙江零跑科技股份有限公司_202311863228.9

一种裸金属镜像部署的方法、装置及介质_杭州吉利汽车数字科技有限公司_202410274496.5

基于分布式部署的薪酬数据查询方法及相关设备_深圳平安智汇企业信息管理有限公司_202011339644.5

龙图腾网&IPTOP

【发明授权】模型部署方法、模型部署装置、终端设备及可读存储介质_深圳市智芯华玺信息技术有限公司_202110567899.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务