买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于科研大数据预测的可视化推荐系统及方法_中国科学技术信息研究所_202410039055.7 

申请/专利权人:中国科学技术信息研究所

申请日:2024-01-11

公开(公告)日:2024-04-16

公开(公告)号:CN117556118B

主分类号:G06F16/9532

分类号:G06F16/9532;G06F16/9535;G06F16/9538;G06F18/213;G06F18/2132;G06F18/2135;G06F18/27;G06N3/045;G06N3/0464;G06N3/08;G06F123/02

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2024.03.01#实质审查的生效;2024.02.13#公开

摘要:本发明提供一种基于科研大数据预测的可视化推荐系统及方法。本发明面向目标对象针对性整合科研大数据,从中提取与所述目标对象的研究能力发展趋势具备时间相关性的预测特征序列;进而基于训练优化的预测模型,获得所述目标对象研究能力发展趋势的量化表征;根据量化表征,在可视化交互界面上显示针对目标对象的推荐信息。本发明为用户对科研信息的分析运用提供了带有预测性的指引和参考,提升了科研数据库及其可视化检索分析工具等产品的准确性和易用性。

主权项:1.一种基于科研大数据预测的可视化推荐系统,其特征在于,包括:用户查询接口,用于提供可视化交互界面,通过所述可视化交互界面接收用户输入的查询条件,解析所述查询条件形成查询请求数据;数据检索汇集单元,用于在存储科研大数据的数据库中利用所述查询请求数据进行检索,并以目标对象为单位汇集检索命中的科研数据信息,形成与目标对象相对应的对象数据集,所述对象数据集包含目标对象在一个或多个细分学科上的科研数据信息;预测特征序列建立模块,用于针对所述目标对象,通过统计对应的对象数据集中包含的科研数据信息,获得所述目标对象在一个或多个细分学科的分布特征;并判断所述分布特征与所述目标对象的研究能力发展趋势的时间相关性,根据时间相关性强度确定所述目标对象的研究能力发展趋势的预测特征;进而根据所述预测特征在时间维度上的分布,建立所述目标对象的研究能力发展趋势的预测特征序列;量化预测模块,用于将所述目标对象的预测特征序列输入训练优化后的预测模型,获得所述目标对象研究能力发展趋势的量化表征字段;所述预测模型是以训练集中包含的样本对象的预测特征序列和量化表征字段执行训练优化后获得的神经网络模型;可视化推荐模块,用于根据所述目标对象研究能力发展趋势的量化表征字段,在可视化交互界面上显示针对目标对象的推荐信息;其中,将所述预测特征在时间维度上的分布表示为: ;其中表示第一预测特征在时间维度上的分布,表示第二预测特征在时间维度上的分布,表示第一预测特征相对于第二预测特征的权重比例系数在时间维度上的分布;所述训练集中样本对象的预测特征序列和量化表征字段表示为;其中、为预测特征序列的序列元素,为以上预测特征序列的序列元素各自对应的量化表征字段;量化预测模块在训练所述预测模型的过程中,将训练集随机划分为大小为N的多个子集,其中子集数;这里第个子集;进行多轮训练,每轮训练依次采用一个子集;对于第个子集,将其中每个输入序列特征编码器,每个输入字段特征编码器,获得的特征编码以及的特征编码;和分别表示本轮训练时序列特征编码器和字段特征编码器的参数向量;进而,利用第个子集中的每个和所得的特征编码,形成2组特征编码序列;再对以上2组特征编码序列进行线性投影和归一化:这里和表示本轮训练时线性投影矩阵的参数和,函数表示把一个矩阵进行归一化;通过以上特征编码序列和的相似度,构建训练所述预测模型的损失函数如下:这里,是余弦相似度矩阵的第个元素,该矩阵为:其中是预先设定值的超参数;计算损失函数相对于序列特征编码器、字段特征编码器以及线性投影矩阵的全部参数的梯度:这里表示所有参数组成的参数向量;进而,基于该梯度更新下一轮训练中的以上全部参数: 这里,是学习率;经过多轮训练,输出最优化参数向量,得到训练完成的序列特征编码器、字段特征编码器以及线性投影矩阵,即。

全文数据:

权利要求:

百度查询: 中国科学技术信息研究所 基于科研大数据预测的可视化推荐系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。