【发明授权】一种基于缺陷报告摘要中词性信息的严重程度预测方法_南通大学_202110341218.3

导航：龙图腾网> 最新专利技术> 一种基于缺陷报告摘要中词性信息的严重程度预测方法_南通大学_202110341218.3

申请/专利权人：南通大学

申请日：2021-03-30

公开（公告）日：2023-10-20

公开（公告）号：CN113011179B

主分类号：G06F40/284

分类号：G06F40/284;G06F40/237;G06F18/27;G06F18/241;G06N3/0464

优先权：

专利状态码：有效-授权

法律状态：2023.10.20#授权;2021.07.09#实质审查的生效;2021.06.22#公开

摘要：本发明提供了一种基于缺陷报告摘要中词性信息的严重程度预测方法，通过使用较少数据量实现相近或更优的预测性能，并进一步地利用软件缺陷报告跟踪系统平台上存放的大型项目所含缺陷报告，进行快速且高准确性的软件缺陷报告严重程度的预测。本发明的有益效果为：本发明预测方法首先对缺陷报告中的摘要属性进行文本预处理，得到词根形式的分词；基于大规模文本语料库使用卷积神经网络模型训练，获得包含所属各分词词性和单词间相似度邻接矩阵的Spacy模型，进一步对分词进行筛选，随机抽取并生成相似数据扩充数据集，最终实现对缺陷报告严重程度的预测，相比于其他预测方法使用较少数据实现了更优性能。

主权项：1.一种基于缺陷报告摘要中词性信息的严重程度预测方法，其特征在于，包括如下步骤：S1：从缺陷报告跟踪系统中搜集已标记严重程度且严重程度为Blocker、Critical、Major、Minor、Trivial和Enhancement的缺陷报告，将严重程度为Blocker、Critical、Major的缺陷报告对应严重程度统一设置为“严重”类型，将严重程度为Minor、Trivial、Enhancement的缺陷报告对应严重程度统一设置为“不严重”类型，针对所搜集缺陷报告的摘要进行文本预处理，具体包括：分词、停顿词移除与词形还原，得到词根形式的分词；S2：基于OntoNotes5语料库、GloVeCommonCrawl语料库和所述分词组成的大规模文本语料库，使用卷积神经网络模型进行训练，训练出Spacy模型；S3：对各缺陷报告进行筛选提炼，得到初始数据集Dorg；S4：针对所述初始数据集Dorg，进行数据集扩充，获得扩充后的训练数据集Dtrain；S5：基于步骤S2训练得到的Spacy模型，将训练数据集中各缺陷报告的摘要表示并替换为对应向量；针对单个分词，使用Spacy词向量对其进行相应分词的词向量表示，累加该缺陷报告摘要所包含的所有分词的对应词向量并求平均，得到相应缺陷报告摘要的对应向量；S6：基于所述训练数据集Dtrain，采用逻辑回归分类方法，构建缺陷报告严重程度预测模型M；S7：针对项目内需要进行严重程度预测的新的缺陷报告，对其摘要进行文本预处理后，仅保留其中词性为动词和名词的分词，通过Spacy模型生成其摘要所对应的向量，并累加该缺陷报告摘要所包含的所有分词的对应词向量并求平均，输入步骤S6所构建的缺陷报告严重程度预测模型M，得到其严重程度。

全文数据：

权利要求：

百度查询：南通大学一种基于缺陷报告摘要中词性信息的严重程度预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：刷新注册的容错处理方法、装置、CSCF以及介质_中国电信股份有限公司_202010967419.X

下一篇：一种基于计算机视觉的肺区区域分割系统_东莞理工学院_202210022595.5

相关技术

刷新注册的容错处理方法、装置、CSCF以及介质_中国电信股份有限公司_202010967419.X

一种基于计算机视觉的肺区区域分割系统_东莞理工学院_202210022595.5

一种农产品供应链信息管理系统_河南建设产业投资有限公司_202311393351.9

一种产丙酸的工程益生菌的构建与应用_天津大学_202310196065.7

一种防止带钢在精轧卷取中发生追尾的方法_首钢京唐钢铁联合有限责任公司_202210031884.1

一种含氟塑料加工助剂及其制备工艺_稷昶新材料科技(上海)有限公司_202311471760.6

聚离子弹性体及其制备方法与应用_赛感科技(深圳)有限公司_202211412739.4

泌尿道菌群检测在女性泌尿道结石诊断中的应用_广东省科学院微生物研究所(广东省微生物分析检测中心)_202111500822.2

一种基于Flink流处理的地铁轨道几何检测数据清洗方法_成都国铁电气设备有限公司_202210023454.5

微电网的控制方法及装置_北京天诚同创电气有限公司_202111653363.1

一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

用于运行机动车的方法、调节装置和机动车_奥迪股份公司_202110617439.9

龙图腾网&IPTOP

【发明授权】一种基于缺陷报告摘要中词性信息的严重程度预测方法_南通大学_202110341218.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务