买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种专家合作可行性分析方法_淮阴工学院_202010799399.X 

申请/专利权人:淮阴工学院

申请日:2020-08-11

公开(公告)日:2024-03-29

公开(公告)号:CN112100395B

主分类号:G06F16/36

分类号:G06F16/36;G06F16/338;G06F16/951;G06F40/242;G06F40/284;G06N3/0499;G06N3/088

优先权:

专利状态码:有效-授权

法律状态:2024.03.29#授权;2021.01.05#实质审查的生效;2020.12.18#公开

摘要:发明公开了一种专家合作可行性分析方法,包括:采用Scrapy爬虫框架,收集科技专家的三元组关系数据。对科技专家数据集进行数据预处理,计算每两个实体间属性的相似度以及关联度。利用知识图谱技术与Django前端框架技术为用户提供直观的科技专家可行性分析辅助。本发明的算法模型是通过自适应寻优调参,采用知识图谱技术进行专家合作可行性分析,与传统人工主观的可行性分析相比,可以提供更加直观、准确更并具有普适性的可行性分析。

主权项:1.一种专家合作可行性分析方法,其特征在于,具体步骤如下:(1)利用Scrapy爬虫技术对科技论文项目数据进行数据爬取,将爬取的文本数据集定义为L0,对数据集L0进行处理得到清洗后的数据集,定义为L1;包括以下步骤:(1.1)利用Scrapy对科技专家合作可行性分析辅助系统中的所用数据进行爬取,声明爬虫的地址域,获取词表,构造原始的json文件,生成url列表,通过url获取title,爬取图片的url和开放域的标签;(1.2)将爬取到的科技专家论文、项目每一个实体对应科技专家的一个词条,其中包括项目名称title、项目链接url、项目成员people、项目内容content,所属单位unit;(1.3)获取到科技专家数据库L;(1.4)对科技专家数据库L中的数据进行数据清洗,去除残缺数据,得到数据集,定义为Lc;(1.5)除去数据集Lc中外文数据及非中文数据后得到数据集,定义为Lw;(1.6)给数据集Lw中定分词结果,提取命名实体的数据集,定义为L1;(2)对清洗数据集L1处理,得到专家合作数据集,定义为矩阵数据集L2;(3)搭建项目的整体运行框架;(4)构建DNN深度神经网络训练词向量模型W1;(5)通过Django封装接口从web前端获取科技专家姓名Z2、Z3,进行相似度计算,利用词向量模型W1得出相似度,定义为Same1;(6)通过Django封装接口从web前端获取科技专家姓名Z2、Z3,进行关联度计算,得到关联度,定义为Correlation;(7)抽取科技专家论文项目文本数据实体间的关系,建立并调用对应科技专家知识图谱;(8)构建Web前端,neo4j数据库系统之间的运行结构,调用知识图谱E,传输至Web前端展示页面;(9)开放科技专家合作可行性分析系统及科技专家实体关系图数据库API接口,用户通过Web前端页面返回的Return文件进行科技专家合作可行性分析;包括以下步骤:(9.1)开放科技专家合作可行性分析系统及科技专家实体关系图数据库API接口;(9.2)用户登录,创建线程池ThreadPool,等待线程池WaitThreadPool;(9.3)置入等待线程池WaitThreadPool;(9.4)检测ThreadPool是否已满,如未满跳至步骤(9.5),否则返回步骤(9.3)继续等待;(9.5)用户通过Web平台输入查询项目内容或科技专家姓名;(9.6)子线程ChildThread获取任务处理;(9.7)判断输入数据属性,如属于项目数据则跳至步骤(9.8),如属于科技专家姓名数据跳至步骤(9.9);(9.8)根据文本相似度调用知识图谱E中对应知识图数据,跳转至步骤(9.11);(9.9)计算领域相似度Same1;(9.10)计算关联度Correlation;(9.11)结束子线程ChildThread;(9.12)结果写入返回文件Return;(9.13)关闭线程池ThreadPool;(9.14)通过Web将返回文件Return返回给用户。

全文数据:

权利要求:

百度查询: 淮阴工学院 一种专家合作可行性分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。