申请/专利权人:四川大学
申请日:2024-03-08
公开(公告)日:2024-04-09
公开(公告)号:CN117850870A
主分类号:G06F8/73
分类号:G06F8/73;G06N3/0455;G06N3/0895
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.26#实质审查的生效;2024.04.09#公开
摘要:本申请提供了一种代码注释生成方法、装置、电子设备及存储介质,重命名原代码函数名并随机替换标识符信息构建相似代码;以原代码与对应相似代码为正样本对,以原代码与同一批次下其他相似代码为负样本对,通过预设对比学习辅助模型进行对比学习,生成原代码对应的代码向量表征;加载上述模型得到的参数信息,将目标原代码与相应注释信息输入至以代码预训练模型为基础构建的端到端神经网络模型进一步优化代码向量表征;将优化代码向量表征输入解码器输出代码注释。通过保留关键词的数据增强方式构造高质量代码,采用对比学习辅助任务得到高质量代码表征,同时使用两阶段训练策略防止数据增强带来偏差问题,并进一步学习代码高质量表征。
主权项:1.一种代码注释生成方法,其特征在于,应用于代码注释生成模型,所述方法包括:获取目标原代码,重命名所述目标原代码对应的函数名,并随机替换原代码对应的标识符信息构建相似代码;以所述目标原代码与对应所述相似代码为正样本对,以所述目标原代码与同一批次下其他所述相似代码为负样本对,通过预设对比学习辅助模型进行对比学习,生成所述目标原代码对应的代码向量表征并优化所述代码注释生成模型的模型参数;加载所述模型参数,将所述目标原代码以及对应的注释信息,输入至以代码预训练模型为基础构建的端到端神经网络模型,进一步优化所述代码向量表征;将优化后的所述代码向量表征输入至所述代码注释生成模型的解码器,根据所述解码器的输出生成代码注释。
全文数据:
权利要求:
百度查询: 四川大学 一种代码注释生成方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。