申请/专利权人:中央军委装备发展部装备价格评审中心;中国电子科技集团公司第五十二研究所
申请日:2023-12-18
公开(公告)日:2024-04-09
公开(公告)号:CN117853179A
主分类号:G06Q30/0283
分类号:G06Q30/0283;G06F18/214;G06F18/23;G06F18/22;G06F40/295;G06F40/258
优先权:
专利状态码:在审-公开
法律状态:2024.04.09#公开
摘要:本发明公开了一种基于软件审价数据功能簇的发现与审价应用的方法,包括获取报价包及对应报价包匹配的支撑材料,解析报价包的信息得到项目信息、计价对象信息、估算对象信息和估算对象信息的功能描述。本基于软件审价数据功能簇的发现与审价应用的方法通过对报价包的信息和对应的支撑材料中的信息进行相似度匹配,使得报价包的信息和对应的支撑材料进行映射对应,得到估算对象,然后对估算对象进行处理得到语义向量后录入向量数据库,对新的估算对象审价时,将新的估算对象与向量数据库进行对比检索,输出候选价格方案;通过向量数据库,给出对新的估算对象的价格的参考,具有很好的逻辑解释性和知识积累性。
主权项:1.一种基于软件审价数据功能簇的发现与审价应用的方法,其特征在于:所述基于软件审价数据功能簇的发现与审价应用的方法,包括:获取报价包及对应报价包匹配的支撑材料,解析报价包的信息得到项目信息、计价对象信息、估算对象信息和估算对象信息的功能描述,并将项目信息、计价对象信息、估算对象信息和估算对象信息的功能描述依次分级设置构成第一树状数据结构;根据支撑材料的文档类型,读取支撑材料的内容,得到大纲信息,对大纲信息中的符合估算对象信息的功能描述的标题以及标题的具体内容构成第二树状数据结构;采用相似匹配算法对第一树状数据结构中的非叶子节点和第二树状数据结构中的非叶子节点进行相似度匹配,将匹配后的第一树状数据结构中的数据和第二树状数据结构中的数据作为估算对象;对估算对象分别进行分词处理和命名实体识别抽取,形成领域词和命名实体,然后将领域词和命名实体构建短语,将领域词、命名实体和短语分别对Word2Vector模型和SentenceEmbedding模型进行训练;利用训练好的Word2Vector模型和SentenceEmbedding模型分别对估算对象进行向量表示,然后利用BERTopic聚类算法对向量表示进行聚类处理,并对聚类后的每个分类抽取主题词;利用训练好的SentenceEmbedding模型对主题词进行主题表示,利用训练好的Word2Vector模型对估算对象进行语义表示,然后对该两类表示进行联合合成语义向量后录入向量数据库;对新的估算对象进行审价时,对新的估算对象完成语义向量生成,与向量数据库进行近义检索,同时采用BM25算法对新的估算对象的名称和功能描述与向量数据库进行关键词检索,两个检索结果做加权合成,按照评分高低进行排序,对评分超过阈值的前N个候选结果,与新的估算对象名称和功能描述中相交的词汇或短语进行高亮,对前N个候选结果进行统计分析描述,输出候选价格方案。
全文数据:
权利要求:
百度查询: 中央军委装备发展部装备价格评审中心;中国电子科技集团公司第五十二研究所 一种基于软件审价数据功能簇的发现与审价应用的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。