买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于数据强弱关联模型的数字人文应用方法_吉玖(天津)技术有限责任公司_202311318274.0 

申请/专利权人:吉玖(天津)技术有限责任公司

申请日:2023-10-12

公开(公告)日:2024-04-12

公开(公告)号:CN117349386B

主分类号:G06F16/28

分类号:G06F16/28;G06F16/45;G06F16/483;G06N5/022;G06F18/22

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2024.01.23#实质审查的生效;2024.01.05#公开

摘要:本发明公开了一种基于数据强弱关联模型的数字人文应用方法,涉及数字人文技术领域,包括以下步骤:S1、数据收集;S2、对S1获取的原始数据进行预处理;S3、数字化与信息建库;S4、数据关系构建;S5、知识重构;S6、实体关系转换为节点信息网络;S7、节点间强弱关系计算;S8、数据强弱关系模型构建;S9、构建和管理节点交互关系;S10、隐含关系揭示。本发明采用上述的一种基于数据强弱关联模型的数字人文应用方法,基于大数据分析、数据挖掘、机器学习,并采用数据强弱关联模型,结合强弱关系、动态权重调控等技术,该模型能够更精准地预测节点之间的关系,优化信息传播路径,提高信息的利用效率。

主权项:1.一种基于数据强弱关联模型的数字人文应用方法,其特征在于,包括以下步骤:S1、数据收集;S2、对S1获取的原始数据进行预处理;S3、数字化与信息建库;针对不同类型的文件,系统需要进行上下文识别,以理解文件的内容,对于每个文件,从中提取元数据信息,对于图像和视频文件,进行对象探测和抽取,将提取的元数据信息和上下文识别的内容存储到关系型数据库中,对于图片、视频媒体文件,建立一个图库数据库,将抽取的对象信息、图像特征存储其中;S4、数据关系构建;将数据库的数据形成集合,根据数据集合建立知识组织模型、人物关联数据集、数据领域本体,发现数据静态关联;S5、知识重构;基于维度扩展的动态知识组织,基于实体画像的语义标签抽取,融合成基于知识图谱的数据动态聚合;S6、实体关系转换为节点信息网络;S7、节点间强弱关系计算;S8、数据强弱关系模型构建;S81模型定义;S82、定义总节点集、边集、有限信息集合、强弱关系节点集、邻居节点、信息网络;S83、建立过程模型;结合过程模型和预测算法,利用余弦相似度原理和强弱关系动态权值进行动态调控关系,获取个体发展所必要的资源的最优路径;在步骤S81中,包括假设信息网络中有N个网络节点,其中节点i是其中的一个,定义一,总节点集:I为总节点集合,I={1,2,3,...,N},i,j∈I;定义二,边集:E为节点的关系集合,E={1,2,3,...,N},e∈E;定义三,有限信息集合:节点i所拥有的有限信息集合记为Ri,表示为Ri=[Ri,1,...,Ri,H},其中H≥0,表示节点i的信息总数;定义四,强弱关系节点集:强关系节点集NSi是由节点i的强关系节点组成的集合,用二元向量Xi,j表示节点之间的强弱关系,若Xi,j=1,表示j∈NSi,即节点j是节点i的强关系节点;弱关系节点集NWi是由节点i的弱关系节点组成的集合,若Xi,j=α,则表示j∈NWi,其中0α1,则节点j是节点i的弱关系节点;定义五,邻居节点:与节点i有边相连的节点均为邻居节点,邻居节点的数量记为K,节点i的所有邻居节点构成邻居节点集合Ni,其中,Ni=NSi∪NWi,节点j是i的邻居节点则满足二元向量关系:0<Xi,j≤1,其中j∈Ni;定义六,信息网络:信息网络由各个节点和节点之间的关系组成,表示为RG,即RG={I,E|0Xi,j1,i,j∈I,e∈E};在步骤S82中,包括以下步骤:S821、初始化节点i的强关系节点集NSi,以及节点i所拥有的有限信息集合Ri;S822、在时刻t,节点i的信息种类为H,信息集合为和分别表示在时刻t节点i和节点j拥有的信息r的数量,节点i从信息网络中获取信息,首先同强关系节点集NSi中的节点进行信息交互;S823、在时刻t+w,节点i所拥有的信息发生改变,这一变化受两种原因影响,公式 其中,表示在时刻t+w,有限信息集合Ri,r的变化量,ρ为挥发系数,0ρ1,表示随着时间推移,节点拥有的信息数量会逐渐减少,γ表示对信息改变的信任参数,0γ1,表示在时刻t,有限信息集合Ri,r的信息量;随着时间推移和自身的成长和环境的改变,新的信息不断纳入到新的集合中,时,表示信息Ri,r在w时刻发生了变化;当节点与强关系网络成员发生交互时,节点i的信息发生变化,公式 公式 判断需要交换的不同网络节点拥有的信息是否相同,以及相同信息的数量是否一致,其中φ表示对于与强关系节点发生交互的信任参数,j∈NSi,即节点j是节点i的强关系节点;S824、在经历t+w时刻后,当节点i与弱关系网络节点发生交互时,节点i以概率p加入到弱关系集合NWi,节点i的信息变化受到强弱关系两方面的影响,公式 其中,k∈NWi,即节点k是节点i的弱关系节点,δ表示对于与弱关系节点发生交互的信任参数,其中表示在时刻t+w,有限信息集合Rj,r的信息量,表示在时刻t+w,有限信息集合Rk,r的信息量;S825、在时刻t+w,通过标准差σ判断信息网络的稳定性 σt为方差,I为总节点集合个数,i为节点,H为有限信息集合个数,r为有限信息节点,N为网络节点个数;在步骤S83中,包括以下步骤:S831、基于步骤S81中的定义一和定义二构建网络图G=I,E,使用标签来标记中心节点和其他节点,节点i对应标签fi;S832、根据节点i相对于节点x和节点y的半径,分别记为di,x和di,y,中心节点的标签为1,di,x,di,y=1,1对应的节点标签fi=2;di,x,di,y=1,2或2,1对应的节点标签fi=3,以此类推;两个中心节点,其中标签fi和双半径di,x,di,y满足:di,x+di,y≠dj,x+dj,y时,di,x+di,y=dj,x+dj,y时,依据DRNL算法生成一个整数标签函数fli, 其中,dx=di,x,dy=di,y,d=dx-dy,对于di,x=∞或di,y=∞的节点,记作空标签0,dx,dy分别表示节点i相对于节点x和节点y的半径,d表示dx,dy的差值;S833、根据节点i相对于节点x和节点y的半径,判断节点i与x、y之间的关系,当di,x=1=di,y,且fi=2时,表示节点i与x、y有相同的关系程度且都呈现强关系,反之则为弱关系;di,x<di,y时,节点i与x的关系强于i与y的关系;S834、利用余弦相似度计算公式来反映节点之间的强弱关系,余弦相似度根据两个向量的夹角余弦值来度量个体间的相似度,值在0至1之间,越接近1表示相似度越高,越接近0表示相似度越低,对于多维向量Aa1,b1,c1...和Ba2,b2,c2...,a1,b1,c1...和a2,b2,c2...表示在不同维度上的分量,具体计算公式 其中,cosθ表示三角函数里面的余弦,A和B为要比较的两个向量,||A||和||B||表示向量A和向量B的范数,通常是欧几里德范数,表示为它们的模,Ai和Bi分别表示向量A和向量B中第i个元素,分别表示向量A和向量B中元素的平方之和;S835、由于节点i对不同中心节点产生不同的强弱关系,为每个关系赋予不同的动态权重,具体计算如下:对于节点i与节点x之间的相似度 对于节点i与节点y之间的相似度 其中,w1和w2分别为节点强关系、弱关系权重;w3和w4分别为节点i与x、y之间的弱关系程度权重;k为网络中除fi=1外的节点数、k1为网络中fi=2的节点数、k2为k中除k1外的节点数,具体计算见公式 通过这一预测算法结合节点之间的相似度、动态权重以及判断的关系计算和动态权重调控,确定节点之间产生强弱关系的可能性,某些节点之间的关系尚未被明确识别时,利用余弦相似度和动态权重,并揭示未识别的隐藏式关系,从而得到个体发展所需资源的最优路径;S9、构建和管理节点交互关系;S10、隐含关系揭示。

全文数据:

权利要求:

百度查询: 吉玖(天津)技术有限责任公司 一种基于数据强弱关联模型的数字人文应用方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。