首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】程序说明文档生成方法、装置、电子设备和可读介质_南京数睿数据科技有限公司_202311535017.2 

申请/专利权人:南京数睿数据科技有限公司

申请日:2023-11-16

公开(公告)日:2024-05-17

公开(公告)号:CN117539538B

主分类号:G06F8/73

分类号:G06F8/73;G06F18/25

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2024.03.01#实质审查的生效;2024.02.09#公开

摘要:本公开的实施例公开了程序说明文档生成方法、装置、电子设备和可读介质。该方法的一具体实施方式包括:根据目标程序包对应的树状文件目录,获取目标程序包;根据程序文件对应的编程语言类型,对程序文件进行程序块提取,以生成程序块信息,得到程序块信息组;对于每个程序块信息,执行以下第一处理步骤:对程序块信息包括的程序块注释信息进行注释特征提取;对程序块信息包括的程序块代码信息进行代码特征提取;对程序块注释特征和程序块代码特征进行交叉特征融合;根据程序块融合特征,生成针对程序块信息的程序块说明信息;根据得到的程序块说明信息集合,生成针对目标程序包的程序说明文档。该实施方式提高了程序说明文档的编写效率。

主权项:1.一种程序说明文档生成方法,包括:根据目标程序包对应的树状文件目录,获取所述目标程序包,其中,所述目标程序包是待生成对应程序说明文档的软件程序包,所述目标程序包包括:至少一个程序文件;对于所述至少一个程序文件中的每个程序文件,根据所述程序文件对应的编程语言类型,对所述程序文件进行程序块提取,以生成程序块信息,得到程序块信息组,其中,程序块信息对应的程序块表征以下之一:函数块,结构体块和类块,程序块信息包括:程序块注释信息和程序块代码信息;对于得到的程序块信息组集合中的每个程序块信息,执行以下第一处理步骤:对所述程序块信息包括的程序块注释信息进行注释特征提取,以生成程序块注释特征;对所述程序块信息包括的程序块代码信息进行代码特征提取,以生成程序块代码特征;对所述程序块注释特征和所述程序块代码特征进行交叉特征融合,以生成程序块融合特征;根据所述程序块融合特征,生成针对所述程序块信息的程序块说明信息;根据得到的程序块说明信息集合,生成针对所述目标程序包的程序说明文档;对于所述程序块说明信息集合中的每个程序块说明信息,执行以下第二步骤:对所述程序块说明信息进行关键词提取,以生成关键词集合;生成所述关键词集合中的每个关键词对应的关键词向量,得到关键词向量集合;确定所述关键词向量集合中的每个关键词向量和所述程序块说明信息对应的程序块融合特征的特征相似度;根据关键词向量对应的特征相似度,对所述关键词集合中的关键词进行排序,以生成关键词序列;根据得到的关键词序列组中的关键词对应的关键词词频,对所述关键词序列组中的关键词进行词排序,以生成关键词数组,其中,关键词词频表征关键词在关键词序列组的出现频率;对于所述关键词序列组中的每组关键词序列,将目标程序块说明信息对应的程序块融合特征与所述关键词序列在所述关键词数组中对应的关键词进行关联,其中,所述目标程序块说明信息是所述关键词序列对应的程序块说明信息;响应于接收到待实现功能描述信息,对所述待实现功能描述信息进行词粒度分割,以生成候选词集合;从所述候选词集合中筛选出满足第一筛选条件的候选词,作为功能描述词,得到功能描述词集合;将所述功能描述词集合与所述关键词数组进行词匹配,以激活与所述关键词数组关联的、程序块说明信息对应的激活向量中的向量值,其中,激活向量中的向量值的数量与程序块说明信息在所述关键词数组中对应的关键词的数量相同,激活向量中的向量值在词匹配成功时处于激活状态,激活向量中的向量值在词匹配失败时处于非激活状态;将对应的激活向量满足第二筛选条件的至少一个程序块说明信息返回至目标终端,其中,所述目标终端是发送所述待实现功能描述信息的终端,其中,所述根据目标程序包对应的树状文件目录,获取所述目标程序包,包括:深度遍历所述树状文件目录,以确定所述树状文件目录包括的文件名对应的文件,作为候选文件,得到候选文件集合;根据预设文件类型列表,对所述候选文件集合进行文件过滤,得到所述目标程序包,其中,所述根据所述程序文件对应的编程语言类型,对所述程序文件进行程序块提取,以生成程序块信息,包括:响应于确定所述程序文件对应的编程语言类型为第一编程语言类型,通过与所述第一编程语言类型对应的第一正则表达式列表,对所述程序文件进行遍历;响应于遍历到第一行位置,执行以下第一提取步骤:提取第一作用域内的程序代码,作为第一候选程序代码;对所述第一候选程序代码进行注释和代码分离,以得到程序块信息包括的程序块注释信息和程序块代码信息,其中,所述第一行位置是与所述第一正则表达式列表中的第一正则表达式匹配的位置,以所述第一行位置为起始位置的、由所述第一行位置对应的起止符框定的区域为所述第一作用域的子区域;响应于确定所述程序文件对应的编程语言类型为第二编程语言类型,通过与所述第二编程语言类型对应的第二正则表达式列表,对所述程序文件进行遍历;响应于遍历到第二行位置,执行以下第二提取步骤:提取第二作用域内的程序代码,作为第二候选程序代码;对所述第二候选程序代码进行注释和代码分离,以得到程序块信息包括的程序块注释信息和程序块代码信息,其中,所述第二行位置是与所述第二正则表达式列表中的第二正则表达式匹配的位置,以所述第二行位置为起始位置的、满足字符缩进条件的区域为所述第二作用域的子区域。

全文数据:

权利要求:

百度查询: 南京数睿数据科技有限公司 程序说明文档生成方法、装置、电子设备和可读介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。