【发明公布】基于多头注意力机制的深度学习代码抄袭检测方法_华南理工大学_202310257808.7

导航：龙图腾网> 最新专利技术> 基于多头注意力机制的深度学习代码抄袭检测方法_华南理工大学_202310257808.7

申请/专利权人：华南理工大学

申请日：2023-03-16

公开（公告）日：2023-09-12

公开（公告）号：CN116738963A

主分类号：G06F40/194

分类号：G06F40/194;G06F40/211;G06F40/253;G06F40/284;G06F40/30;G06F18/22;G06N3/044;G06N3/0464

优先权：

专利状态码：在审-实质审查的生效

法律状态：2023.09.29#实质审查的生效;2023.09.12#公开

摘要：本发明公开了一种基于多头注意力机制的深度学习代码抄袭检测方法，包括：1使用代码解析工具将源代码解析成抽象语法树；2以语句节点作为分解粒度，将抽象语法树以深度优先遍历的方式分解成一组抽象语法子树；3使用递归神经网络生成抽象语法子树的代码向量，使用多头自注意力机制、残差网络获取抽象语法子树的代码向量的特征，采用全连接网络将抽象语法子树的代码向量表示成一个固定长度的向量，通过余弦相似性计算两份代码的相似性，相似性超过阈值的代码判定为抄袭，未超过阈值的判定为未抄袭；4使用注意力机制，将判定为抄袭的两份代码进行源代码相似性的标注。本发明实现了端到端的源代码抄袭检测算法，可实现更灵活和精确的下游应用。

主权项：1.基于多头注意力机制的深度学习代码抄袭检测方法，其特征在于，包括以下步骤：1使用代码解析工具将源代码解析成抽象语法树；2以语句节点作为分解粒度，将抽象语法树以深度优先遍历的方式分解成一组抽象语法子树；3使用递归神经网络生成抽象语法子树的代码向量，使用多头自注意力机制、残差网络获取抽象语法子树的代码向量的特征，采用全连接网络的方式将抽象语法子树的代码向量表示成一个固定长度的向量，最后通过余弦相似性计算两份代码的相似性，相似性超过阈值的代码判定为抄袭，未超过阈值的判定为未抄袭；4使用注意力机制，将判定为抄袭的两份代码进行源代码相似性的标注。

全文数据：

权利要求：

百度查询：华南理工大学基于多头注意力机制的深度学习代码抄袭检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种五轴坐标设备快速定制后处理模块的方法_中国航发沈阳黎明航空发动机有限责任公司_202211397667.0

下一篇：轴对称应力条件下顶管泥浆套减阻性能测定装置及方法_西安理工大学_202110840090.5

相关技术

一种五轴坐标设备快速定制后处理模块的方法_中国航发沈阳黎明航空发动机有限责任公司_202211397667.0

轴对称应力条件下顶管泥浆套减阻性能测定装置及方法_西安理工大学_202110840090.5

一种基于RRT算法的双机械臂解耦运动规划方法及系统_国网上海市电力公司_202110430722.0

用于输送物料的步进式循环动力装置_天津新玛特科技发展有限公司_201910898294.7

管接头用螺母、管接头、流体压力设备及流体控制系统、螺母旋转用夹具及螺旋旋转方法_SMC株式会社_202011038931.2

一种串并联型超高频直流变换装置_华南理工大学_202210604929.X

一种小粒种子播后镇压器及镇压方法_张家口市农业科学院(河北省高寒作物研究所)_202210810875.2

估计浓度的装置和方法以及生成浓度估计模型的装置_三星电子株式会社_201910738775.1

一种多功能土壤用缓释剂及其制备方法_海南大学_202211273266.4

一种立式镗铣床加工用除杂装置_蚌埠市富瑞达机床机械制造有限公司_202011602435.5

基于区域约束的低虚警目标检测方法_中国电子科技集团公司第十四研究所_202011081745.7

非激活态UE进行状态转换方法和用户终端及网络侧设备_大唐移动通信设备有限公司_202010256391.9

龙图腾网&IPTOP

【发明公布】基于多头注意力机制的深度学习代码抄袭检测方法_华南理工大学_202310257808.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务